login  Naam:   Wachtwoord: 
Registreer je!
 Forum

Federated Search Engine

Offline laurent_davi - 24/11/2012 16:26 (laatste wijziging 26/11/2012 14:30)
Avatar van laurent_daviLid beste,

ik ben al een tijdje bezig met de studie over een federated search engine,

mijn bedoeling is om de federated search engine te willen overzetten naar een Sharepoint Search.

wat ik zoek is (en wat ik denk met sharepoint federated search kan) een zoekinterface op basis van wat in het zoekscherm wordt ingegeven voor verschillende webdatabanken de correcte url creert om een zoekactie in die databank te creeren.
De federated search moet al die resultaten opvangen en in één scherm tonen.

dit is onze huidige zoekmotor:
http://www.isci...uery=water

hieronder heb ik een connector van de zoekmachine; de informatie wordt eignelijk uit de website gescraped via vb. html tags:

RIZIV CONNECTOR

  1. <source modified-by="ivs@IVS" max-elt-id="267" name="riziv" maintainers="ivs" display-name="B. RIZIV" modified="1184796510">
  2. <submit>
  3. <form>
  4. <call-function name="standard-form">
  5. <with name="action-value">http://www.riziv.fgov.be/nl/result.asp?ref=a </with>
  6. <with name="method-value">POST</with>
  7. <with name="query-param">query</with>
  8. <with name="page-param">page</with>
  9. <with name="page-offset">0</with>
  10. </call-function>
  11. <input name="Submit" value="Zoeken" />
  12. <input name="page" value="0" />
  13. <input name="scope" value="/" />
  14. <input name="stype" value="1" />
  15. <input name="doctype" value="all" />
  16. <input name="taal" value="nl" />
  17. <input name="searchtype" value="1" />
  18. <input name="rubriek" value="" />
  19. <input name="sortering" value="rank" />
  20. <input name="order" value="[d]" />
  21. </form>
  22. <parser>
  23. <call-function name="regex-parser
  24. ">
  25. <with name="case-sensitive">true</with>
  26. <with name="START">&lt;tr>&lt;td valign="top" class="noJustify">1</with>
  27. <with name="END">&lt;i>&lt;a href="search.asp">&lt;br></with>
  28. <with name="RESULT_START">&amp;nbsp;&lt;/td>&lt;td class="noJustify"></with>
  29. <with name="RESULT_END">&lt;/td>&lt;/tr></with>
  30. <with name="URL_START">&lt;a href="</with>
  31. <with name="URL_END">" target="_blank"></with>
  32. <with name="TITLE_START">&lt;b></with>
  33. <with name="TITLE_END">&lt;/b>&lt;/a></with>
  34. <with name="DES_START">&lt;br></with>
  35. <with name="DES_END">&lt;br></with>
  36. <with name="URL_BASE">http://www.riziv.fgov.be</with>
  37. </call-function>
  38. </parser>
  39. </submit>
  40. <tests />
  41. <help />
  42. <description />
  43. </source>

de bedoeling is om het geheel te hosten op 4 virtuele windows machines;
- sharepoint fronted
- microsoft SQL server
- proxy ( naar de publishers)
- IIS (web server) voor STS (secure Token service)

volgens mij moeten we de zoekdata realtime gaan ophalen vanuit de verschillende sites, deze parsen en doorsturen naar sharepoint via RSS/Atom

DATABASE -> Connector ->Zoekresultaten Parsen ->code om resultaten om te vormen naar RSS FEED output -> New content search (SP) -> results.aspx (SP)




hopelijk kan iemand me een stapje in de goede richting helpen.. ik heb me er al suf over gepiekert.. 

alle ideeën of voorstellen zijn welkom.

bedankt alvast,
laurent

4 antwoorden

Gesponsorde links
Offline marten - 25/11/2012 09:14
Avatar van marten Beheerder Het is alleen een beetje jammer dat zo'n mooie uitleg geen duidelijke vraagstelling bevat. Het is in ieder geval een heel leuk project waar een ieder wat aan kan hebben. Maar wil je hier even uitleggen wat er al gedaan is? Wat er moet gebeuren? Wat is er mislukt? Wat werkt er wel en wat werkt er niet?
Offline laurent_davi - 25/11/2012 20:32
Avatar van laurent_davi Lid Marten,

indd sorry voor mijn onduidelijkheid.

in feite heb ik het theoretisch allemaal opgezocht en onderzocht, maar om dit over te brengen in de praktijk is iets anders.

ik weet niet goed te beginnen met de connector die spreekt met de database-website..


mvg
Laurent
Offline marten - 26/11/2012 11:03
Avatar van marten Beheerder De connector moet dus spreken met de database website. Is dit dan output van de connector naar de website of is het connector die scraped van de website?
Bedankt door: laurent_davi
Offline laurent_davi - 26/11/2012 12:33
Avatar van laurent_davi Lid het is de connector die scraped van de website.
Gesponsorde links
Je moet ingelogd zijn om een reactie te kunnen posten.
Actieve forumberichten
© 2002-2024 Sitemasters.be - Regels - Laadtijd: 0.167s