Extraindo informações de texto em python

votos
-1

Eu sou novo para a mineração de texto. Eu tenho um arquivo CSV. Eu preciso passar por cada linha e extrair algumas informações, em seguida, escrevê-los em outro arquivo CSV. Estou à procura de informação específica que eu tenho em um dicionário. Considere abaixo frase:

A versão do aplicativo é 1.8.2 ea skt.len variável passa as informações necessárias. Arquivo ReadMe.txt tem as especificações.

Meu dicionário é: [ versão do aplicativo variável, file,]

Eu preciso extrair:

  • versão do aplicativo: 1.8.2
  • variável: skt.len
  • file: ReadMe.txt

Qual é a melhor maneira de extrair tais informações de texto? Eu estou jogando com características NLTK e StanfordCoreNLP. Mas, eu não poderia extrair a informação. Estou pensando em usar regex para extrair a versão do aplicativo. Qualquer ideia?

PS: Eu sei que isso pode tornar a tarefa mais complicada. Mas, frases em cada linha do arquivo CSV pode ter diferentes estruturas. Por exemplo: versão da aplicação em uma linha, pode ser versão app em outra linha. Ou file em uma linha pode ser filename em outra linha.

Publicado 02/09/2018 em 05:25
fonte usuário
Em outras línguas...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more