Eine einfache aber wirkungsvolle Methode.. :)

html_entity_decode ist eigentlich nicht die Methode die man immerzu braucht.. Aber nachdem ich jetzt ungelogen 6h damit zu gebracht habe und diese Funktion mich nun letztendlich erlöst hatte, möchte ich gern erzählen wo man sie brauch ^^

Ich arbeite gerade an einem Projekt wo ich Daten einer Webseite extrahieren muss um sie auf der eigenen entsprechend darstellen zu können. Dazu muss man der Seite für eine Suche daten senden, einen Link folgen, einen weiteren Link folgen und dann auf ALLE Anzeigen klicken können. Das klingt erstmal nicht aufregend – in dem konkreten Fall benötigte man aber eine Session ID usw.

Mein Problem war nun nicht das extrahieren der Daten oder die Cookies oder dergleichen. Sondern jedesmal wenn CURL den Link aufgerufen hat bekam ich die Startseite. Fügte ich die URL in den Browser ein kam die richtige Seite – da kann man echt verrückt werden.

das Problem bestand nun darin das CURL die HTML Entinies nicht versteht… mit Hilfe von html_entity_decode habe ich diese decodiert und der CURL übergeben.. nett von der Webseite das sie diese codiert haben..

html_entity_decodeKonvertiert alle benannten HTML-Zeichen in ihre entsprechenden Ursprungszeichen

Ja wehe es sagte einer  „Ja klar, das weiß man“ 😀

Über den Autor Danny Sotzny

Hallo, ich bin Danny Sotzny und bin Software- entwickler und Fotograf. Dabei beschäftige ich mich mit aktuellen Technologien und bekannten Problemen. Schwerpunkte setze ich bei der Webentwicklung (PHP/JS) und der Software- entwicklung mit .NET (C#). Der Blog dient für mich selbst als Gedächtnishilfe für typische und alltägliche Probleme, aber auch persönliche Erlebnisse werden veröffentlicht. Ich betreibe zusätzlich noch Foto-Sotzny.de für meine Fotografien und sotzny.net, was meine Webseite für die Softwareentwicklung ist.

Leave a Reply

See also:

%d Bloggern gefällt das: