lista por um mau funcionamento de aplicações web Python

votos
0

Eu sou novo para o site, eu não tenho certeza se este é o lugar correto para fazer perguntas python, se não, por favor avise-me e eu vou voltar a postar isso para o local correto. Preciso de ajuda com um código que eu estou trabalhando em para minha classe Coursera, o objetivo é o seguinte: Encontre o link na posição 18 (o primeiro nome é 1). Siga esse link. Repetir este processo de 7 vezes. A resposta é o último nome que você recuperar. Dica: A primeira letra do nome da última página que você irá carregar é: J de ligação :( http://py4e-data.dr-chuck.net/known_by_Shannon.html )

Eu escrevi um código para esta tarefa, mas parece que ele só trabalhou para o primeiro item, e cada local desde aquele primeiro, lista mau funcionamento do código. Minha idéia é fazer com que o código HTML e acrescentar a url em uma lista, em seguida, encontrar o item 18 da lista, em seguida, redirecionar o loop inteiro com o novo URL e excluir a lista de idade. Repetindo o processo para a 7 vezes. Estou seriamente confuso com o fato de onde exatamente o código deu errado. Desde já, obrigado.

    import urllib.request, urllib.parse, urllib.error
from bs4 import BeautifulSoup
import ssl
import re
term_counter = (0)
file = list()
regex = list()
# Ignore SSL certificate errors
ctx = ssl.create_default_context()
ctx.check_hostname = False
ctx.verify_mode = ssl.CERT_NONE

url = input('Enter - ')
for I in range(7) :
    html = urllib.request.urlopen(url, context=ctx).read()
    soup = BeautifulSoup(html, 'html.parser')
    tags = soup('a')
    del file[:]
    file = list()
    for tag in tags :
        file.append(tag)
        print(tag.contents[0])
        url = tag.get('href')
        print (url)
    for items in range(17,18) :
        print(file[items])
Publicado 02/09/2018 em 05:22
fonte usuário
Em outras línguas...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more