traian.rebedea Site Admin
Joined: 19 Oct 2006 Posts: 101
|
Posted: Sun Nov 19, 2006 2:30 am Post subject: Schema de functionare |
|
|
Următoarele acţiuni definesc, în mare, funcţionarea unui astfel de sistem de stiri:
1. Inspectarea periodică a siturilor agenţiilor de ştiri şi ziarelor ce oferă RSS şi colectarea automată a sindicărilor noi;
2. Introducerea ştirilor din cadrul fiecărui RSS nou într-o bază de date, pentru a oferi acces mai uşor la aceste informaţii;
3. Prelucrarea informaţiei text a fiecărei ştiri noi, prin aplicarea diverselor tehnici lingvistice, pentru determinarea vectorului caracteristic – numărul de apariţii al fiecărui cuvânt;
4. Gruparea ştirilor folosind un algoritm de clustering pentru texte, pornind de la reprezentarea ştirilor în spaţiul m-dimensional al cuvintelor;
5. Clasificarea fiecărui grup de ştiri în cadrul unei categorii predefinite, folosind un clasificator care este reantrenat în mod regulat;
6. Generarea automată a paginilor web corespunzătoare subiectelor celor mai importante dintr-o anumită perioadă, grupate în diverse modalităţi, inclusiv pe fiecare categorie de ştiri. Aceste pagini web constituie rezultatul final al funcţionării portalului şi sunt vizibile de către utilizatori;
7. Generarea automată a sindicărilor RSS şi Atom oferite de portal, în conformitate cu subiectele folosite la pasul 6.
Acţiunile elementare descrise anterior, pot fi rulate atât într-o singură etapă, în mod secvenţial, urmând ordinea precizată, cât şi individual, la momente de timp diferite. Modul de funcţionare este determinat de cantitatea fluxurilor RSS preluate, de numărul ştirilor noi într-o anumită perioadă, cât şi de intervalul de timp la care situl este modificat automat.
Pentru acest proiect nu trebuie sa implementati toate aceste faze. Daca lucrati individual este suficient sa faceti pasii 1-3 + clustering sau clasificare + o modalitate de afisare a rezultatelor. Daca vreti sa formati o echipa de 2 persoane, trebuie sa implementati 1-3 + clustering + clasificare + afisare. |
|