{"id":218,"date":"2011-11-22T18:32:13","date_gmt":"2011-11-22T18:32:13","guid":{"rendered":"http:\/\/luisteixeira.org\/Myblog\/?page_id=218"},"modified":"2012-01-24T21:11:21","modified_gmt":"2012-01-24T21:11:21","slug":"topixtract","status":"publish","type":"page","link":"http:\/\/luisteixeira.org\/Myblog\/prototipos\/topixtract\/","title":{"rendered":"TOPIXTRACT"},"content":{"rendered":"<!-- Chitika - WordPress Plugin 2.2--><div class='chitika-adspace above'>\n<script type='text\/javascript'>\n  ( function() {\n    if (window.CHITIKA === undefined) {\n      window.CHITIKA = { 'units' : [] };\n    };\n    var unit = {\n      'publisher'       : 'themaskedwolf',\n      'width'           : 550,\n      'height'          : 250,\n      'sid'             : \"wordpress-plugin above\",\n      'color_site_link' : '0000CC',\n      'color_title'     : '0000CC',\n      'color_text'      : '000000',\n      'color_bg'        : 'ffffff',\n      'font_title'      : 'Arial',\n      'font_text'       : 'Arial',\n      'impsrc'          : 'wordpress',\n      'calltype'        : 'async[2]'\n    };\n    var placement_id = window.CHITIKA.units.length;\n    window.CHITIKA.units.push(unit);\n    var x = \"<di\" + \"v id='chitikaAdBlock-\"+placement_id+\"'><\/di\"+\"v>\";\n    document.write(x);\n}());\n<\/script>\n<script type=\"text\/javascript\" src=\"\/\/cdn.chitika.net\/getads.js\" async><\/script>\n<\/div>\n<p><\/p>\n<h2>TOPIXTRACT<\/h2>\n<p>Trata-se de um sistema composto por 4 componentes, 3 m\u00f3dulos gr\u00e1ficos (aplica\u00e7\u00f5es) e uma base de dados relacional.<\/p>\n<p>No primeiro m\u00f3dulo, o administrador do sistema tem de configurar as op\u00e7\u00f5es necess\u00e1rias para que os textos sejam processados e introduzidos na base de dados.<\/p>\n<p>\nA Pr\u00f3xima imagem ilustra este m\u00f3dulo.<br \/>\n<figure id=\"attachment_248\" aria-describedby=\"caption-attachment-248\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/luisteixeira.org\/Myblog\/wp-content\/uploads\/2012\/01\/Mod1.png\" alt=\"TOPIXTRACT-FirstModule\" title=\"Module1\" width=\"300\" height=\"172\" class=\"size-medium wp-image-248\" \/><figcaption id=\"caption-attachment-248\" class=\"wp-caption-text\">TOPIXTRACT-FirstModule<\/figcaption><\/figure><br \/>\n<\/p>\n<p>Os campos que podemos observar permitem ao administrador do sistema cconfigurar v\u00e1rios campos de configura\u00e7\u00e3o:<br \/>\nAlguns destes campos s\u00e3o descritos na lista abaixo:<\/p>\n<ul>\n<li><b>&#8220;Insert Prefix Size number&#8221;<\/b> &#8211; O tamanho do prefixo de uma palavra a ser considerado. (Necess\u00e1rio para algumas medidas com bons resultados para as linguas altamente flexionadas)<\/li>\n<li><b>&#8220;Insert Language Prefix&#8221;<\/b> &#8211; Esta necessidade adv\u00e9m da possibilidade de ter na mesma base de dados documentos de diversas l\u00ednguas distintas. Visto que este prot\u00f3tipo resulta independentemente da l\u00edngua que se esteja a trabalhar.<\/li>\n<li><b>&#8220;Project Short Name&#8221;<\/b> &#8211; Podemos ter tamb\u00e9m varis grupos de documentos relativos a \u00e2mbitos diferentes, da\u00ed a possibilidade de atribuir um nome de projecto a um conjunto de documentos a tratar.<\/li>\n<li>Possui tamb\u00e9m campos para configurar as v\u00e1rias directorias de configura\u00e7\u00e3o a usar no arranque do sistema.\n<ul>\n<li>Uma delas \u00e9 <b>&#8220;Files Folder Location&#8221;<\/b> &#8211;  directoria onde est\u00e3o localizados os ficheiros txt ( em UTF8 ) que formam o corpus a tratar ( <b>Nota:<\/b> Quantos mais documentos e extensos melhor.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>Depois destas configura\u00e7\u00f5es o administrador tem acesso a dois bot\u00f5es, um que lhe permite abrir uma consola que mostrar\u00e1 um log  das opera\u00e7\u00f5es que est\u00e3o a ser efetuadas pelo m\u00f3dulo.<br \/>\nO bot\u00e3o de arranque &#8220;Run&#8221; que inicio o processamento e carregamento para a base de dados relacional.<\/p>\n<hr align=\"center\" width=\"50%\" \/>\n<p>O segundo m\u00f3dulo \u00e9 a aplica\u00e7\u00e3o onde avaliadores humanos ( linguistas ) v\u00e3o avaliar, de acordo com regras estabelecidas \u00e0 priori, os t\u00f3picos extra\u00eddos utilizando as v\u00e1rias medidas disponiveis, neste momento medidas que t\u00eam como base Tf-Idf e Chi-Quadrado.<\/p>\n<p>Apresenta algumas caracteristicas, nomeadamente a de o avaliador ter de fazer um &#8220;login&#8221;  por forma a, quando a informa\u00e7\u00e3o de uma determinada avalia\u00e7\u00e3o for feita, esta poder ser facilmente seguida.<\/p>\n<figure id=\"attachment_249\" aria-describedby=\"caption-attachment-249\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/luisteixeira.org\/Myblog\/wp-content\/uploads\/2012\/01\/Mod2_1.png\" alt=\"M\u00f3dulo 2 - Primeiro Passo\" title=\"module2_1\" width=\"300\" height=\"195\" class=\"size-medium wp-image-249\" \/><figcaption id=\"caption-attachment-249\" class=\"wp-caption-text\">M\u00f3dulo 2 - Primeiro Passo<\/figcaption><\/figure>\n<p>Seguindamente descreve-se a funcionalidade de alguns campos.<\/p>\n<ul>\n<li><b>&#8220;Insert Evaluator Name&#8221;<\/b> &#8211; Campo onde o Avaliador escreve o nome que o identifica.<\/li>\n<li><b>&#8220;Bot\u00e3o Set&#8221;<\/b> &#8211; Serve para que o nome do avalidor seja guardado em BD, e activa os demais campos.<\/li>\n<li> Componentes relativos a trabalhar com a informa\u00e7\u00e3o de documentos\n<ul>\n<li><strong>&#8220;Choose Language of Documents&#8221;<\/strong> Campo onde o avaliador filtra os documentos pela l\u00edngua dos mesmos.<\/li>\n<li><strong>&#8220;Choose Document Project&#8221;<\/strong> Como os documentos podem estar associados a projectos especificos, estes podem ser escolhidos neste campo. Caso contr\u00e1rio aparecer\u00e3o todos os documentos disponiveis naquela l\u00edngua.<\/li>\n<\/ul>\n<\/li>\n<li>Existem componentes relativos a trabalhar especificamente ccom os termos de cada Documento\n<ul>\n<li>Por exemplo <strong>&#8220;Number of Terms to Get&#8221;<\/strong> O avaliador escolhe o n\u00famero de termos a carregar para cada documento, op\u00e7\u00f5es de 25, 50 e 100 dispon\u00edveis.<\/li>\n<\/ul>\n<\/li>\n<\/ul>\n<p>As Seguintes Imagens, mostram o M\u00f3dulo 2 em fazes mais avan\u00e7adas de utiliza\u00e7\u00e3o por parte de um avaliador. <br \/>\nPode-se observar nas mesmas, um documento seleccionado da lista, bem como a listagem de termos mais bem pontuados para a medida Tf-Idf. \n<\/p>\n<table border=\"1\">\n<tr>\n<td><figure id=\"attachment_250\" aria-describedby=\"caption-attachment-250\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/luisteixeira.org\/Myblog\/wp-content\/uploads\/2012\/01\/Mod2_2.png\" alt=\"M\u00f3dulo 2\" title=\"Second Module \" width=\"300\" height=\"195\" class=\"size-medium wp-image-250\" \/><figcaption id=\"caption-attachment-250\" class=\"wp-caption-text\">M\u00f3dulo 2  - Segundo Passo<\/figcaption><\/figure><\/td>\n<td><figure id=\"attachment_255\" aria-describedby=\"caption-attachment-255\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/luisteixeira.org\/Myblog\/wp-content\/uploads\/2012\/01\/Mod2_3.png\" alt=\"M\u00f3dulo 2\" title=\"Second Module\" width=\"300\" height=\"195\" class=\"size-medium wp-image-255\" \/><figcaption id=\"caption-attachment-255\" class=\"wp-caption-text\">M\u00f3dulo 2 - Terceiro Passo<\/figcaption><\/figure><\/td>\n<\/tr>\n<\/table>\n<p>Seguidamente descrevem-me mais alguns campos em mais pormenor.<\/p>\n<ul>\n<li>O conte\u00fado do documento aparece nos seguintes campos <b>&#8220;Document treated Content&#8221;<\/b>  e <b>&#8220;Document Original Content&#8221;<\/b><\/li>\n<li><strong>Evaluation Buttons<\/strong>, servem para o avaliador clossificar os termos apresentados, numa das 4 categorias poss\u00edveis, que s\u00e3o  <strong>&#8220;Good&#8221;<\/strong>, <strong>&#8220;Near Good&#8221;<\/strong>,<strong>&#8220;Bad&#8221;<\/strong>  and <strong>&#8220;Unkown&#8221;<\/strong>.\n  <\/li>\n<li><strong>&#8220;Save Evaluation&#8221;<\/strong> Permite ao avaliador guardar a avalia\u00e7\u00e3o que efectuou numa base de dados, para posteriormente ser trabalhada no m\u00f3dulo 3. Como veremos a seguir.<\/li>\n<\/ul>\n<hr align=\"center\" width=\"50%\" \/>\n<p>O terceiro m\u00f3dulo que constitui o sistema e a aplica\u00e7\u00e3o permite ter acesso aos resultados de precis\u00e3o e cobertura resultantes das avalia\u00e7\u00e3o de determinado avaliador. <br \/> <br \/>\nBem como a ter acesso a gr\u00e1ficos de correla\u00e7\u00e3o entre avaliadores distintos sobre um mesmo documento. Outras funcionalidades existem, mas saem do \u00e2mbito para descrever nesta p\u00e1gina.<\/p>\n<p>Na seguinte imagem pode-se ver uma panor\u00e2mica do terceiro m\u00f3dulo, num estado inicial.<\/p>\n<figure id=\"attachment_251\" aria-describedby=\"caption-attachment-251\" style=\"width: 300px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/luisteixeira.org\/Myblog\/wp-content\/uploads\/2012\/01\/Mod3_1.png\" alt=\"Third Module - Empty Overview\" title=\"module3_1\" width=\"300\" height=\"201\" class=\"size-medium wp-image-251\" \/><figcaption id=\"caption-attachment-251\" class=\"wp-caption-text\">Third Module - Empty Overview<\/figcaption><\/figure>\n<hr align=\"center\" width=\"50%\" \/>\n&nbsp;<\/p>\n<p style=\"text-align: center;\"><strong>Qualquer informa\u00e7\u00e3o adicional, n\u00e3o hesite em contactar-me.<\/strong><\/p>\n<p style=\"text-align: center;\">lst<a href=\"http:\/\/www.google.com\/recaptcha\/mailhide\/d?k=019E04HH5yGpgFS8ByKX0WFA==&amp;c=-b_7XlVHfRUKwN8l_JOrMXuHDI-oiT_w8MUgSm4qe2g=\" onclick=\"window.open('http:\/\/www.google.com\/recaptcha\/mailhide\/d?k\\075019E04HH5yGpgFS8ByKX0WFA\\75\\75\\46c\\75-b_7XlVHfRUKwN8l_JOrMXuHDI-oiT_w8MUgSm4qe2g\\075', '', 'toolbar=0,scrollbars=0,location=0,statusbar=0,menubar=0,resizable=0,width=500,height=300'); return false;\" title=\"Reveal this e-mail address\">&#8230;<\/a>teixeira.org<\/p>\n<p><\/p>\n\n<!-- Facebook Like Button v1.9.6 BEGIN [http:\/\/blog.bottomlessinc.com] -->\n<iframe src=\"http:\/\/www.facebook.com\/plugins\/like.php?href=http%3A%2F%2Fluisteixeira.org%2FMyblog%2Fprototipos%2Ftopixtract%2F&amp;layout=button_count&amp;show_faces=true&amp;width=450&amp;action=like&amp;colorscheme=light\" scrolling=\"no\" frameborder=\"0\" allowTransparency=\"true\" style=\"border:none; overflow:hidden; width:450px; height: 60px; align: left; margin: 2px 0px 2px 0px\"><\/iframe>\n<!-- Facebook Like Button END -->","protected":false},"excerpt":{"rendered":"<p>TOPIXTRACT Trata-se de um sistema composto por 4 componentes, 3 m\u00f3dulos gr\u00e1ficos (aplica\u00e7\u00f5es) e uma base de dados relacional. No primeiro m\u00f3dulo, o administrador do sistema tem de configurar as op\u00e7\u00f5es necess\u00e1rias para que os textos sejam processados e introduzidos <a class=\"more-link\" href=\"http:\/\/luisteixeira.org\/Myblog\/prototipos\/topixtract\/\">Continue reading <span class=\"screen-reader-text\">  TOPIXTRACT<\/span><span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":210,"menu_order":0,"comment_status":"closed","ping_status":"open","template":"","meta":{"footnotes":""},"class_list":["post-218","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/pages\/218","targetHints":{"allow":["GET"]}}],"collection":[{"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/comments?post=218"}],"version-history":[{"count":41,"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/pages\/218\/revisions"}],"predecessor-version":[{"id":233,"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/pages\/218\/revisions\/233"}],"up":[{"embeddable":true,"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/pages\/210"}],"wp:attachment":[{"href":"http:\/\/luisteixeira.org\/Myblog\/wp-json\/wp\/v2\/media?parent=218"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}