O que posso usar para determinar palavras ou palavras-chave semelhantes?

votos
2

Alguém sabe de um algoritmo de palavras ou palavras-chave semelhantes disponível em código aberto ou através de uma API? Eu estou procurando algo como uma espécie de enciclopédia, mas de forma mais inteligente.

Assim, por exemplo:

intel

retorna:

processador,
chip principal i7,
chip principal quad,
etc ..

Qualquer idéias ou até mesmo algo para me apontar na direção certa em C #?


Editar:

Eu adoraria ouvir seus pensamentos, mas porque nos nao podemos apenas usar a API do Google Adwords para gerar palavras-chave relevantes para as inscritas?

Publicado 19/05/2009 em 15:27
fonte usuário
Em outras línguas...                            


4 respostas

votos
5

Por que não enviar uma consulta de pesquisa para o Google e analisar o que ele retorna?

Além disso, confira Google Sets .

Respondeu 19/05/2009 em 15:30
fonte usuário

votos
2

Não há algoritmo para uma coisa dessas. Você vai ter de adquirir dados para um Thesaurus, e carregá-lo em uma estrutura de dados, então é uma pesquisa de dicionário simples (você pode usar o C # Dicionário classe para isso). Talvez você pode olhar para Wordnet , ou Moby Thesaurus como fonte de dados. Outras opções são usando um servidor Thesaurus e obter as informações online, conforme necessário.

Respondeu 19/05/2009 em 15:29
fonte usuário

votos
0

Eu fiz as funções thesaurus escritório aberto disponível para .NET no projeto NHunspell. Você pode usar os arquivos OO Thesaurus. Aqui é o Projeto NHunspell

Respondeu 28/10/2009 em 08:06
fonte usuário

votos
0

Você vai precisar de um grande banco de dados que contém essas informações. O resto é simples - procure a entrada e ver o que releated palavras são armazenados.

A parte mais difícil é a geração do banco de dados. Fazê-lo manualmente pode levar anos se você quiser cobrir um grande número de palavras e temas.
Gerando é ranzinza não-trivial. Talvez você poderia tentar baixar páginas web e analisar palavras freqüentemente aparecem juntos, mas eu suponho que isso ainda vai demorar meses para construir, ajustar e, finalmente, recolher dados de boa qualidade. Talvez ligações extração de Wikipedia pode ser uma boa fonte de informação devido à sua semi-estrutura.

Respondeu 19/05/2009 em 15:34
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more