diff --git a/%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5-%D0%BE%D1%81%D0%BD%D0%BE%D0%B2%D0%BD%D1%8B%D1%85-%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D1%85-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86.md b/%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5-%D0%BE%D1%81%D0%BD%D0%BE%D0%B2%D0%BD%D1%8B%D1%85-%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D1%85-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86.md new file mode 100644 index 0000000..1466b29 --- /dev/null +++ b/%D0%A1%D0%BE%D0%B7%D0%B4%D0%B0%D0%BD%D0%B8%D0%B5-%D0%BE%D1%81%D0%BD%D0%BE%D0%B2%D0%BD%D1%8B%D1%85-%D0%B8%D0%BD%D1%84%D0%BE%D1%80%D0%BC%D0%B0%D1%86%D0%B8%D0%BE%D0%BD%D0%BD%D1%8B%D1%85-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86.md @@ -0,0 +1,22 @@ +Страницы со статической информацией, которые уже есть на mkgtu.ru мы копируем с помощью сервиса PageScrapper.php. При создании экземпляра мы передаем в конструктор 2 переменных - url страницы, которую копируем и строку с устойчивым выражением, по которому будем отбирать нужный текст. + +Методы: + +getHTML() - отбираем нужный текст, пишем в переменную + +normalizeURLFile($content) - передаем переменную выше сюда и выбираем все ссылки. Там где нужно добавляем https, чтобы сделать нормальные пути. + + public function cutHTML($content,$strForScissors) - передаем всю страничку сюда, и строчку с устойчивым выражением, по которому будем отбирать фрагменты кода для удаления + +Пример работы: + +@php + use App\Services\PageScrapper; + $pageScrapper = new PageScrapper("https://mkgtu.ru/postuplenie/podat-dokumenty-onlayn/", '
'); + $row = $pageScrapper->getHTML(); + $content = $pageScrapper->normalizeURLFile($row); + $content = $pageScrapper->cutHTML($content,'//isU'); + echo $content; +@endphp + +