Разбор на съдържанието на вашия сайт

съдържание за синтактичен анализ: Въведение

Да предположим, че ние се интересуваме от информацията е там, на който и да е трета страна сайт и там се актуализира. Разбира се, можете да посетите сайта периодично с информация, да го копирате от и актуализиране на вашия сайт прословутия: Ctrl + C и Ctrl + V. Но вие не можете да отидете и да се възложи задачата на един прост скрипт - анализатор, който по поръчка: ще отидат за донор на сайта, намерете и обособяването на информацията, ние трябва и ще го покаже на нашия сайт. Казано по-просто, информацията от друг сайт ще бъде публикуван на вашата напълно автоматично. Ако перспектива дъгата за вас - четете нататък.







Липсва ми да мисля за етичната страна на този случай, докоснете само техническата страна. Също така, аз не се обади никой да използвате този метод, за сметка на някой друг! След като приключва с техническите подробности по случая, а след това можете да се подготвите специфични джаджи за вашия уеб сайт, като предоставя на своите потребители с подходяща и полезна информация за тях. Всичко зависи от полета на мислите си!

Така че, напишете скрипт, който идва на всеки сайт, изважда част от информацията, необходима за нас и го публикува на сайта ни - като че ли нищо не се е случило :). Не умения за програмиране не са ви нужни, правят всичко точка по точка и се опитват изпълнение в блога си.

Прилагането на този инструмент в PHP

Може би най-решаващият момент в нашия случай - е да се намери донор, който е сайтът, на който ще се появи информацията, от интерес за нас. Сайтът трябва да работи гладко, изпълнили задълженията си за актуализиране на информацията, редовно и текстът трябва да е отворен (т.е., преглед на изходния код на страницата в браузъра - ние трябва да видим къде сме се интересуват от информацията).

Когато се открие мястото на донор и са необходими при нас за разбор страница, запаметява своя URL и да преминете към следващата стъпка. Създаване на текстов файл в Notepad, например parser.php и поставете следния код:

Така че, някои 8 реда код и съдържание от трета страна се публикуват автоматично в нашия блог. Red в кодовите определените за това места, които трябва да редактирате, зелено - ако е необходимо. Ако не е необходимо, можете просто да премахнете тези редове, или да ги забрани да се обработват (Искам да кажа на линията, в която зелен текст) - поставя преди шиене две наклонени черти - //

Имаме нужда от изясняване на парчета с код / ​​текст, който оформи текста, който ни искат? Толкова е просто, ние трябва да посочите начална и крайна позиция в текста, който искате да анализираме. Отваряне на началната страница на сайта и търсене на донора нас искат да текста. Обикновено, той ще започне с някакъв вид на HTML-маркиране, нещо подобно на това -

и завършва със същия безсмислици - например, . Копирайте героите в началните и крайните позиции (2 и 3 червени линии). Не забравяйте, че нашата азбука Sparsit текст, който се намира между тези позиции онлайн.







Интеграция с PHP анализатора в WordPress

Така че, анализатор готов. Неговата работа е била тествана, резултатите са доста. Но как да се покаже sparsenny съдържанието на страницата или в WordPress запис?

Ако въведете кода по-горе, за да пускате WordPress дори в режим на HTML, от съображения за сигурност WordPress скриптове тя просто се изрязва - цензурата не пропусна.

Със стойности прозорци-1251 и UTF-8 играят, да се движи (в зависимост от първоначалното кодиране на донора и мястото на пациента).

Предупреждавам ви, че това е най-простият изпълнението на анализатора в PHP, но в някои случаи се изисква нищо повече (за повечето блогъри).

Да, сценарият се задейства.

това е, което даде валидатор

От линия 1, колона 1; за линия 1, колона 24

Грешка: Element глава липсва задължителен например на правото на собственост на детето елемент.

От линия 1, колона 1; за линия 1, колона 24

Съдържанието модел за елемент на главата:
Ако документът е документ вградена рамка srcdoc или ако заглавието е на разположение от протокол от по-високо ниво: нула или повече елементи на метаданни за съдържанието, от които не повече от една е заглавие елемент и не повече от един е основен елемент.
В противен случай: Един или повече елементи на метаданни за съдържанието, от които точно един е заглавие елемент и не повече от един е основен елемент.

Грешка: Stray краен маркер Разделение.

От линия 4, колона 13; за линия 4, колона 18

Грешка: Stray краен маркер Разделение.

От линия 39, колона 9; за линия 39, колона 14

Грешка: Stray краен маркер Разделение.

От линия 272, колона 1; за линия 272, колона 6

Грешка: Атрибутът itemprop е посочен, но елементът не е собственост на някой елемент.

От ред 2, колона 17; за линия 2, колона 57

Грешка: Атрибутът itemprop е посочен, но елементът не е собственост на някой елемент.

От линия 3, колона 21; за линия 3, колона 80

Вячеслав посрещане, искахме да направим работещ съответствие с времето за информатор, и изправени позьор
Сам махало на сайта на донор е както следва

846
° С
° F
Беше като 5 ° C41 ° F2 часа преди в метеорологична станция (38 км) е 5.8 ° С,
+42 ° F, облачно време, атмосферното налягане в нормални граници, висока влажност (71%), светло вятър (2 м / сек) (7 km / h) (4 мили / час) (4 възела) (2 Bft) разпенващ от север-североизток. Слаб дъжд.

Трябва ли твърде много да се намали чрез всички str_replace или опции?
Аз трябва да го приведе всички до формата
8
Беше като 5 ° С
облачно време, атмосферно налягане в нормални граници, висока влажност (71%), светло вятър (2 m / и) (7 km / h)

Здравейте, кажете ми как да получите най-новата серия с помощта на разбор. Кодът изглежда например така:
серия 2
серия 3
серия 4
епизод 5
епизод 6
серия 7

всичко, което трябва, е да донесе най-новата серия, тоест, "Серия 7"

По принцип, всички елементи могат да бъдат поставени в масива и премахване на последния елемент чрез array_pop
например:

морално и етично страна не се притеснявай, всичко е наред. Просто подготвя за движение, която вече се проточи с години. ((А ръчно да актуализирате файлове на дневна база, не е достатъчно, по всяко време.

Spars може да бъде, но ще бъде на HTML версия на сайта (без двигател).
Можете да плъзнете по същия начин върху съдържанието на двигателя на сайта, но това ще бъде разбор + сайт за настройка

Аз не съм напълно изяснен, но ще трябва да използвате променливи (ги изпрати, за да публикувате скрипт или GET заявка).