login  Naam:   Wachtwoord: 
Registreer je!
 Forum

[C#.NET 2008] Zoeken op inhoud van document

Offline dbe123 - 07/06/2009 19:34
Avatar van dbe123Lid Hoi,

Ik probeer een applicatie te maken, die bij het laden een bepaalde folder op de lokale harde schijf zal gaan indexeren.

De bedoeling is, dat er een soort van index gemaakt wordt van de inhoud van de documenten van bovenstaande folder, waarin de C# applicatie vervolgens kan gaan zoeken.

De folder waarover ik spreek, is een folder met meer dan 10 GB aan Word-documenten, PDF-documenten en Excel-spreadsheets.

Ik heb al wat gegoogled maar echter zonder resultaat;
Het enige wat ik vond, was een Open Source Library genaamd "Lucene.NET", maar deze krijg ik niet aan de praat.  

Kan iemand me helpen??  

3 antwoorden

Gesponsorde links
Offline Abbas - 07/06/2009 20:55
Avatar van Abbas Gouden medaille

Crew .NET
Wat wil je bedoelen met "indexeren". Moet er enkel wat informatie van de bestanden (zoals naam, grootte, ...) gegeven worden of ook echt inhoud? Als het enkel wat basisinformatie is heb ik wel een lapje code. 
Offline Koen - 07/06/2009 20:57
Avatar van Koen PHP expert Volgens mij bedoelt hij echt de inhoud van het bestand 
Offline dbe123 - 07/06/2009 21:20 (laatste wijziging 08/06/2009 21:01)
Avatar van dbe123 Lid Titjes, zoals koen reeds aangaf, gaat het hem echt over de inhoud van het document.

M.a.w., als er 5 documenten zijn waar het woord "school" in voorkomt, moet de zoekmotor deze 5 documenten weergeven bij deze zoekterm (hiermee bedoel ik ofwel de bestandsnaam, als link naar het bestand, of het path naar het bestand wat eveneens als link werkt).

ik weet dat het niet simpel is, ik probeer zelf al een paar weken dit voor elkaar te krijgen, echter zonder resultaat.

Wat ik al gevonden heb qua libraries:
Lucene.NET
Site

Searcharoo-project
Site

Beiden héél mooie projecten, en veelbelovend, maar ik krijg ze niet aan de praat. Ze handelen immers over een ASP.NET site, die aangestuurd wordt door VB.NET of C#.NET.

Ik moet dit echter vanuit een Windows Application kunnen doen, wat het wat moeilijker maakt.
Een Client-OS heeft immers standaard geen Indexing Service draaien, terwijl een I.I.S. Server dit wel heeft.

Dat maakt de challenge nog wat groter.  

Mijn probeersels met beide projecten heb ik intussen verwijderd, ik heb enkel nog een clean solution (zonder search-functionaliteit).
De probeersels waren immers (wegens te veel prutsen) gecrasht en ik kon ze niet meer builden.  

  EDIT: Ik zat te denken of het géén oplossing is om een API te includen van bijvoorbeeld Windows Search. Deze de folder te laten indexen, en vervolgens de index doorlopen vanuit de code.
Iemand ervaring met een dergelijk project?
Gesponsorde links
Dit onderwerp is gesloten.
Actieve forumberichten
© 2002-2024 Sitemasters.be - Regels - Laadtijd: 0.185s