Bóc tách html
-
Chào mọi người,
Em muốn lấy dữ liệu từ trang web như Foody.vn. Hiện tại em đã lấy được cái link(href) của từng cái địa điểm đó....em muốn đi vào link đó để lấy những nội dung chi tiết thì em phải viết thế nào... em cần mọi người giúp đỡ. Cám ơn mọi người rất nhiều!!!
-
@Nguyen-Di thì bạn đưa ds vào vòng lặp rồi thực hiện như với cái link ban đầu đó
-
Định viết thư viện crawler à bạn
-
@Henry-Pham um bạn...bạn có ý tưởng gì hk? góp ý giúp t với
-
dùng night-mare cũng được bạn
Example : https://github.com/nguyenpham93/Crawling_Nightmare/blob/master/crawl_foody.js
-
@Quang-Nguyễn nếu làm như bài của bạn thì mình muốn đưa cái obj vào mogoose thì mình phải làm sao vậy bạn?
-
ông khoa phạm có hướng dẫn 4 clip về cái này:
1/ https://www.youtube.com/watch?v=jKXg6YUxy60
2/ https://www.youtube.com/watch?v=RyH5v7QRm7o
3/ https://www.youtube.com/watch?v=yb-o3TSZB70
4/ https://www.youtube.com/watch?v=r0TRdrGMF4Y
-
bạn muốn lấy content hay comment
cái sườn là bạn viết 1 script download content về, rồi tạo 1 config cho nó đi lấy: thời gian đăng bài, content .. bằng jquery. rồi cheerio load nội dung download về, dùng config đó để lọc content là xong.
-
@Quang-Nguyễn mình làm giống bài của bạn..nhưng mình muốn goto vao nhiều url thì phải làm s z bạn!!!