Страницы со статической информацией, которые уже есть на mkgtu.ru мы копируем с помощью сервиса PageScrapper.php. При создании экземпляра мы передаем в конструктор 2 переменных - url страницы, которую копируем и строку с устойчивым выражением, по которому будем отбирать нужный текст.
Методы:
getHTML() - отбираем нужный текст, пишем в переменную
normalizeURLFile($content) - передаем переменную выше сюда и выбираем все ссылки. Там где нужно добавляем https, чтобы сделать нормальные пути.
public function cutHTML($content,$strForScissors) - передаем всю страничку сюда, и строчку с устойчивым выражением, по которому будем отбирать фрагменты кода для удаления
Пример работы:
@php use App\Services\PageScrapper; $pageScrapper = new PageScrapper("https://mkgtu.ru/postuplenie/podat-dokumenty-onlayn/", '<div class=["']content_info["']>'); $row = $pageScrapper->getHTML(); $content = $pageScrapper->normalizeURLFile($row); $content = $pageScrapper->cutHTML($content,'/<footer(.*)</footer>/isU'); echo $content; @endphp