CONTO.PT: uma wordnet difusa
O CONTO.PT é uma evolução do Onto.PT. Quem conta um conto, acrescenta um ponto...
Muito resumidamente, pretende-se aplicar a mesma metodologia para a construção automática de uma wordnet para a língua portuguesa, mas desta vez associar medidas de confiança a cada decisão tomada. As medidas podem ter por base a frequência e/ou redundância de relações em diferentes recursos para o português.
Desta forma, um utilizador poderá optar por utilizar a maior parte do recurso, e assim ter uma maior cobertura, ou poderá aplicar um ponto de corte na confiança, e assim ter um recurso mais pequeno, mas tendencialmente mais confiável.
Disponibilizamos os seguintes recursos relacionados com o CONTO.PT
- CONTO.PT 0.1: primeira versão da wordnet difusa, representada num formato próprio, não padrão.
- cerca de 34 mil synsets difusos
- cerca de 459.254 relações com grau de confiança associado
- CLIP 2.1: conjunto de synsets difusos, em que cada palavra tem um grau de pertença.
- cerca de 20 mil synsets difusos
- 13 mil da classe substantivo
- 1000 da classe verbo
- 5 mil da classe adjectivo
- 620 da classe advérbio
O recursos anteriores foram descobertos numa rede de relações obtida a partir de sete recursos léxico-semânticos abertos, para o português:
Trabalho descrito em:
Hugo Gonçalo Oliveira. CONTO.PT: Groundwork for the Automatic Creation of a Fuzzy Portuguese Wordnet, Proceedings of 12th International Conference on Computational Processing of the Portuguese Language (PROPOR 2016), Tomar, Portugal. Springer. July 2016. [http]
CONTO.PT, por
Universidade de Coimbra,
está licenciado sob uma licença Creative Commons Attribution 3.0 Unported.