פירסור HTML בעזרת BeautifulSoup
אני לומד פייטון ואני כבר יומיים מנסה לקבל את הפרסור של האתר הבא:
http://avishami.com/%D7%A1%D7%98-%D7%A4%D7%95%D7%A8%D7%99%D7%9D-2018/
הקוד שלי ( בינתיים ) נראה כך:
ואני לא מצליח לקבל את ה URL של ZIPPY. ( קישור ל MP3 )
דרך "מקור הדף" אני מקבל את התמונה הבאה "מקור הדף".
ודרך ניסוי וטעייה בפייטון, אני רואה את הקישור שאני זקוק לו איפשהו מתחבא תחת המשתנה T. ( תמונה "משתנה בפייטון" ).
לצערי אני רק מתחיל וזקוק להכוונה נוספת, איך להגיע לאחד מהשניים.
1. למשתנה ;var zippyfile="F4Ui71LR" ( או מה שיש בדף )
2. ללינק עצמו שהגיע מהדף מקור. ( דוגמא למטה )
<a href="//www2.zippyshare.com/v/a0jxRivV/file.html" target="_blank"><div class="dwnbtn dwn-icon"></div></a>
רב תודות.
אני לומד פייטון ואני כבר יומיים מנסה לקבל את הפרסור של האתר הבא:
http://avishami.com/%D7%A1%D7%98-%D7%A4%D7%95%D7%A8%D7%99%D7%9D-2018/
הקוד שלי ( בינתיים ) נראה כך:
קוד:
import requests
from lxml import html
from bs4 import BeautifulSoup
r = requests.get("[URL]http://avishami.com/%D7%A1%D7%98-%D7%98%D7%A8%D7%90%D7%A0%D7%A1-2018[/URL]")
data = r.text
soup = BeautifulSoup(data, "lxml")
v = (soup.find_all('script'))
t = soup.findAll("script", { "type" : "text/javascript" })
d = soup.findAll("div", {"class" : "jp-progress"})
p = soup.find_all("div", attrs={"class"})
p2 = soup.find_all("zippy")
דרך "מקור הדף" אני מקבל את התמונה הבאה "מקור הדף".
ודרך ניסוי וטעייה בפייטון, אני רואה את הקישור שאני זקוק לו איפשהו מתחבא תחת המשתנה T. ( תמונה "משתנה בפייטון" ).
לצערי אני רק מתחיל וזקוק להכוונה נוספת, איך להגיע לאחד מהשניים.
1. למשתנה ;var zippyfile="F4Ui71LR" ( או מה שיש בדף )
2. ללינק עצמו שהגיע מהדף מקור. ( דוגמא למטה )
<a href="//www2.zippyshare.com/v/a0jxRivV/file.html" target="_blank"><div class="dwnbtn dwn-icon"></div></a>
רב תודות.