login  Naam:   Wachtwoord: 
Registreer je!
 Forum

Bepaalde teks filteren

Offline Ijspegel - 16/01/2009 13:50 (laatste wijziging 16/01/2009 13:52)
Avatar van IjspegelNieuw lid Ik heb een HTML bestand gekregen met daarin heel veel informatie. Het is zegmaar steeds een bepaalde code die herhaald wordt (steeds een div/tabel). De structuur van de bestanden is dus precies hetzelfde, alleen zijn de waardes dus iets anders. Ik kan het nu natuurlijk handmatig in mijn database gaan zetten, maar ik zou het wel zo handig vinden als ik dit met een scriptje automatisch zou kunnen doen. Waarschijnlijk moet ik deze werkzaamheden ook elke maand gaan doen, dus dan kan het best veel tijd schelen.

De code ziet er ongeveer als volgt uit:
  1. <div>
  2. <p>Koptekst 1</p>
  3. <table border="0" cellpadding="0" cellspacing="0" width="560" >
  4. <tr>
  5. <td>
  6. <p><a href="/1.html">Normale tekst 1</a></p>
  7. </td>
  8. <td>
  9. <p><a href="/2.html">Normale tekst 2</a></p>
  10. </td>
  11. <td>
  12. <p><a href="/3.html">Normale tekst 3</a></p>
  13. </td>
  14. </tr>
  15. <tr>
  16. <td>
  17. <p><a href="/4.html">Normale tekst 4</a></p>
  18. </td>
  19. <td>
  20. <p><a href="/5.html">Normale tekst 5</a></p>
  21. </td>
  22. <td>
  23. <p><a href="/6.html">Normale tekst 6</a></p>
  24. </td>
  25. </tr>
  26. </table>
  27. </div>


Deze code wordt dus steeds herhaald. Mijn vraag is nu dus eigenlijk hoe ik ervoor kan zorgen dat ik dus alleen steeds over de waardes kan beschikken zodat ik deze daarna in mijn database kan zetten? Ik moet alleen wel het verschil kunnen herkennen tussen de koptekst en de andere waardes.

Ook is het overigens nog zo dat er bovenaan de pagina nog dingen als <title></title> en <head></head> staan, maar deze moeten uiteraard er ook uitgefilterd worden.

Ik hoop dat jullie willen helpen! :-)

2 antwoorden

Gesponsorde links
Offline Wim - 16/01/2009 15:52 (laatste wijziging 16/01/2009 15:52)
Avatar van Wim Crew algemeen Je kan het bestand steeds uitlezen met PHP.net: file_get_contents. Verder raak je met regulaire expressies al ver volgens mij: PHP.net: preg_match
Offline Ijspegel - 16/01/2009 15:55
Avatar van Ijspegel Nieuw lid Het uitlezen lukt ook wel gewoon hoor, maar wat ik daarna moet doen niet (filteren). Ik dacht zelf ook al dat het met reguliere expressies zou moeten en heb er al druk op gezocht. Ik vind het echter zeer lastig.

Zou je mij misschien op weg willen helpen?
Gesponsorde links
Dit onderwerp is gesloten.
Actieve forumberichten
© 2002-2024 Sitemasters.be - Regels - Laadtijd: 0.17s