traian.rebedea Site Admin
Joined: 19 Oct 2006 Posts: 101
|
Posted: Mon Oct 30, 2006 7:06 pm Post subject: Enunt semi-formal al proiectului |
|
|
Scopul acestui proiect este de a construi un sistem de stiri care sa functioneze automat si oarecum inteligent.
Datele de intrare vor fi preluate sub forma de RSS de la agentii de stiri, ziare, reviste, etc.
Printre tehnicile folosite in cadrul acestui proiect se enumara:
- prelucrari asupra textelor (eliminare cuvinte stop, stemming, eventual tagging, named entities recognition);
- clustering (gruparea) articolelor de stiri;
- clasificarea automata a grupurilor de stiri in cateva categorii predefinite;
Conceptele cu nume ar putea fi vizualizate sub forma unei harti in functie de numarul de articole (sau grupuri de articole) in care anumite concepte apar impreuna.
Se pot face diverse imbunatatiri despre care vom mai discuta.
Primul portal de acest gen si cel mai cunoscut in acest moment este Google News.
Last edited by traian.rebedea on Thu Nov 09, 2006 9:29 pm; edited 2 times in total |
|