Jak Udělat Parser

Obsah:

Jak Udělat Parser
Jak Udělat Parser

Video: Jak Udělat Parser

Video: Jak Udělat Parser
Video: КАК СДЕЛАТЬ ПАРСЕР | PYTHON 2024, Smět
Anonim

Analýza je jednou z široce používaných technik v programování webových stránek. Snadno a jednoduše vám umožní získat potřebnou službu na webu pomocí malého počtu příkazů, pokud neexistuje žádný způsob, jak napsat potřebný skript sami.

Jak udělat parser
Jak udělat parser

Instrukce

Krok 1

Nejjednodušší způsob analýzy je pomocí funkce PHP file_get_contents (). Umožňuje vám získat obsah souboru jako textový řetězec. Funkce využívá algoritmus „mapování paměti“, který zvyšuje jeho výkon.

Krok 2

Chcete-li například napsat skript, který analyzuje data z webu Centrální banky Ruské federace, musíte získat obsah stránky XML pomocí příslušné funkce, která dříve definovala datum ve formátu vhodném pro daný web, a poté jej rozdělit pomocí regulárních výrazů. K zobrazení vybrané měny se používá kód získaný z webových stránek banky: $ data = date („d / m / Y“); $ get = file_get_contents (https://www.cbr.ru/scripts/XML_daily.asp ? date_req = $ data); preg_match („/(.*?)/ is“, $ get, $ string); preg_match („/(.*?)/ is“, $ string [1], $ str);

Krok 3

Chcete-li analyzovat samotný soubor XML, existují k tomu také odpovídající funkce. Chcete-li spustit analyzátor, musíte jej inicializovat pomocí xml_parser_create: $ parser = xml_parser_create ();

Krok 4

Poté je určen seznam funkcí, které budou zpracovávat odpovídající značky a textové informace. Jsou nastaveny odpovídající počáteční a koncové obslužné prvky XML: xml_set_element_handler ($ parser, “startElement”, “endElement”);

Krok 5

Data lze číst pomocí standardních funkcí fopen () a fgets () v příslušné smyčce. Obsah souborů se vrací řádek po řádku v xml_parse (). Poslední parametr obsahuje příznak čtení posledního řádku: while ($ content = fgets ($ fparse)) {

if (! xml_parse ($ parser, $ content, feof ($ fparse))) {

echo „Chyba“;

přestávka; }}

Krok 6

Funkce xml_parser_free () se používá k uvolnění prostředků obsazených systémem. Tyto funkce jsou nejvýkonnější při zpracování souborů XML.

Doporučuje: