Chào mừng!

Bằng cách đăng ký với chúng tôi, bạn sẽ có thể thảo luận, chia sẻ và nhắn tin riêng tư với các thành viên khác trong cộng đồng của chúng tôi.

Đăng ký ngay!
  • Chào Khách,
    Bạn cần liên hệ với admin ??? ZALO & TELEGRAM

Cần giúp Hello Mọi Người em Muốn Trợ giúp về crawl

Tham gia
2/4/19
Bài viết
836
Lượt Thích
575
Coins
19,910
Xin chào các anh
trước đã có 1 a hướng dẫn em về khoản crawl về dữ liệu
Nhưng chỉ crawl được duy nhất 1 phần tử vậy từ đoạn code này em muốn crawl nhiều html
và paste ra thì làm như thế nào ạ
Mã:
<?php
set_time_limit(0);
function curl($url){
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_URL, $url );
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE);
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, false);
$data = curl_exec($ch);
curl_close($ch);
preg_match_all('#"file":"(.+?)","la#', $data, $links);
preg_match_all('#class="img-responsive" src="(.+?)" alt=#', $data, $links);
return $links[1];
}
$url = $_GET['url'];
$datas = curl($url);
$link =  str_replace("\/", "/", $datas[0]);
$test =  str_replace("\/", "/", $datas[0]);
?>
<?php echo $link ?>,

<?php echo $test ?>
 
Tham gia
2/4/19
Bài viết
836
Lượt Thích
575
Coins
19,910
Nhiều html là sao bạn?
code trước a dạy em là chỉ crawl được duy nhất 1 class vidu như <img class="class1" src="link" type="aa"/> Thì crawl dạng
preg_match_all('#class="class1"(.+?)" type#', $data, $links);
trog đó preg_match_all chỉ crawl được 1 phần tử đó và ví dụ em muốn crawl thêm 1 class nữa cùng trong code
dang
<img class="class1" src="link" type="aa"/>
<div class="title">title</div>
preg_match_all('#class="class1"(.+?)" type#', $data, $links);
preg_match_all('#class="title">class="class1"(.+?)</div#', $data, $links);
rồi echo ra ý ạ
em không biết thế có được không
 
Tham gia
2/4/19
Bài viết
836
Lượt Thích
575
Coins
19,910
Nhiều html là sao bạn?
và nhiều cái em xem element có link hoặc có id đó mà em crawl lại k đc ạ.. và bắt buộc soi nguồn có mới crawl được vậy làm sao để crawl những id ở trên element đó .. nếu vậy phải dùng curl hả a
 
Tham gia
15/2/19
Bài viết
93
Lượt Thích
18
Coins
3,423
code trước a dạy em là chỉ crawl được duy nhất 1 class vidu như <img class="class1" src="link" type="aa"/> Thì crawl dạng
preg_match_all('#class="class1"(.+?)" type#', $data, $links);
trog đó preg_match_all chỉ crawl được 1 phần tử đó và ví dụ em muốn crawl thêm 1 class nữa cùng trong code
dang
<img class="class1" src="link" type="aa"/>
<div class="title">title</div>
preg_match_all('#class="class1"(.+?)" type#', $data, $links);
preg_match_all('#class="title">class="class1"(.+?)</div#', $data, $links);
rồi echo ra ý ạ
em không biết thế có được không
mình nghĩ bạn nên sử dụng thằng https://simplehtmldom.sourceforge.io/ này sẽ hợp lý hơn., mình thấy nó rất hay.
 
Top Bottom
AdBlock Detected

We get it, advertisements are annoying!

Sure, ad-blocking software does a great job at blocking ads, but it also blocks useful features of our website. For the best site experience please disable your AdBlocker.

I've Disabled AdBlock
No Thanks