Protótipos

Protótipos

TOPIXTRACT

TOPIXTRACT é um extractor de palavras chave de documentos, independente da lingua dos mesmos e foi desenvolvido no âmbite da minha Tese de Mestrado.
Para alcançar esta tarefa, tem em linha de conta palavras, multi-palavras ou prefixos de palavras ( com comprimento fixo a 4 ou 5 caracteres ). Depois aplica 24 medidas estatisticas para indentificar a importância de determinado termo nos documentos onde ocorre.


Os Resultados obtidos podem ser avaliados por avaliadores independentes, e o seu grau de concordância é medido recorrendo à estatistica Kappa. As medidas baseadas em Tf-Idf e Chi-Square mostraram maior precisão. Os prefixos de palavras foram utilizados para lidar com a problemática das línguas altamente flexionadas. Os Prefixos foram utilizados para ajudar a promover as palavras e as multi-palavras como possiveis palavras chave dos documentos.

Mais informação pode ser encontrada no artigo: Luís Teixeira, Gabriel Lopes, and Rita A. Ribeiro, “Automatic Extraction of Document Topics,” in DoCEIS’11 – 2nd Edition of the Doctoral Conference on Computing, Electrical and Industrial Systems, Costa da Caparica, Portugal, 2011, pp. 101–108.


BrainMap



Quantidades enormes de informação presentes nas empresas podem tornar a tarefa de fazer uma pesquisa , ver um tópico ou informações específicas uma tarefa muito difícil.
Portanto, é de suma importância desenvolver ferramentas que facilitem a pesquisa de informações específicas e que permitam apoiar a exploração pelos utilizadores de intranets corporativas (composto de várias centenas de gigabytes de documentos). Embora não explicitamente identificados, muitos destes documentos estão relacionados entre si (direta ou implicitamente).

Este projecto tem como objectivo permitir a representação visual desses documentos e relacioná-los entre si, mas também para explorar essas relações.
A representação, navegação intuitiva e seleção desses conceitos é o grande objectivo deste prototipo. Quando certas relações entre estes conceitos são particularmente relevantes que
podem levar a um fluxo natural de informação e consequente navegação entre eles.

Na página do prorótipo os estudos realizados para o desenvolvimento deste sistema
de apoio de exploração de grafos, aplicados à correlação de documentos e utilizando conceitos de redes complexas pesadas juntamente com o conteúdo textual dos documentos em questão.

 

Qualquer informação adicional, não hesite em contactar-me.

lstteixeira.org