Reformatação dados raspados utilizando Python Selénio Webdriver.

votos
2

Eu quero extrair todos os nomes das marcas na página da Web e colá-lo em um arquivo do Excel (xlsx). O código que usei é:

browser.get(https://www.bluesign.com/industry/manufacturers/references.html)
time.sleep(2)
item_list_new=[]
link = browser.find_element_by_xpath(//div[@class='defaultMain'])
item_list_new.append(link.text)
print(link.text)

links_list_dict = {shows:item_list_new}
df_links_list = pd.DataFrame(links_list_dict)
df_links_list.to_excel(bluesign.xlsx)

O problema é a saída (marcas) parecem estar em uma única linha, uma única coluna. Eu quero que ele apareça em linhas diferentes. Por favor ajude.

Publicado 20/10/2018 em 14:04
fonte usuário
Em outras línguas...                            


1 respostas

votos
0

Apenas use:

>>> df_links_list = pd.DataFrame(links_list_dict).T #Transpose

por exemplo:

>>> a = {"N":["a","b","c","d"]}
>>> c = pd.DataFrame(a).T
>>>c
Out[10]: 
       0  1  2  3
   N   a  b  c  d

se você precisa sem cabeçalho e índice você pode usar:

>>> df_links_list.to_excel('file.xlsx', header=False, index=False)
Respondeu 20/10/2018 em 15:25
fonte usuário

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more