Mẫu tin trang báo VNExpress

Thành viên quá tích cực
Quản trị viên
Ai cần lấy tin trang Vi En Ẹt Rét mà chưa lấy được thì tham khảo mẫu tin của mình xem sao nhé. Mình đã sử dụng cho site của mình để lấy tin các chuyên mục: xả hội , thế giới , kinh tế v.v... và mới test thêm mục thể thao tất cả đều ok.
Code:
<?xml version="1.0" encoding="UTF-8"?>
<config>
<title>Vnexpress</title>
<host_url>http://vnexpress.net</host_url>
<logo></logo>
<block_pattern>div[class=line_col_midnews_top] div[class=box_hot_news],div[class=line_col_midnews_top] div[class=box_sub_hot_news] li,div[class=block_mid_new] li</block_pattern>
<block_title>h1[class=title_news],h3[class=title_news]</block_title>
<block_title_remove>span[class=no_wrap],span[class=txt_num_comment]</block_title_remove>
<block_title_replace></block_title_replace>
<block_url>h1 a,h3 a</block_url>
<block_hometext>h4[class=news_lead],div[class=news_lead]</block_hometext>
<block_hometext_remove></block_hometext_remove>
<block_hometext_replace></block_hometext_replace>
<block_thumb>img</block_thumb>
<block_thumb_alt>h1[class=title_news],h3[class=title_news]</block_thumb_alt>
<block_thumb_attribute>src</block_thumb_attribute>
<detail_bodyhtml>div[class=fck_detail width_common block_ads_connect],div[class=block_content_slide_showdetail block_ads_connect],div[class=width_common space_bottom_20]</detail_bodyhtml>
<detail_bodyhtml_remove>p a,p[style=text-align:right;],div[class=xemthem_new_ver],div[class=social_share],div[class=eclick_ad_holder ad_frame_protection],div[class=block_show_commen width_common]</detail_bodyhtml_remove>
<detail_bodyhtml_replace>Xem thêm</detail_bodyhtml_replace>
<detail_bodyhtml_attribute></detail_bodyhtml_attribute>
<detail_hometext>h3[class=short_intro]</detail_hometext>
<detail_hometext_remove></detail_hometext_remove>
<detail_hometext_replace></detail_hometext_replace>
<detail_author>p[style=text-align:right;]</detail_author>
<detail_author_replace></detail_author_replace>
</config>
1.JPG
2.JPG
Những thông báo như: "ko lấy dc tiêu đề" và "Đã bỏ qua ...." mà ko kèm link liên kết thì đó là do cấu trúc nguồn có những phần giống nhau. Nó ko ảnh hưởng gì tới việc lấy bài viết về site của bạn.

Mẫu tin dành cho trang số hóa của VNExpress
Code:
<?xml version="1.0" encoding="UTF-8"?>
  <config>
    <title>Vnexpress2</title>
    <host_url>http://vnexpress.net/</host_url>
    <logo></logo>
    <block_pattern>div[class=box_hot_news],div[class=box_sub_hot_news] li,div[class=block_mid_new] li</block_pattern>
    <block_title>h1[class=title_news],h2[class=title_news]</block_title>
    <block_title_remove>span[class=no_wrap],span[class=icon_commend]</block_title_remove>
    <block_title_replace></block_title_replace>
    <block_url>a[class=txt_link]</block_url>
    <block_hometext></block_hometext>
    <block_hometext_remove></block_hometext_remove>
    <block_hometext_replace></block_hometext_replace>
    <block_thumb>a img</block_thumb>
    <block_thumb_alt>h1[class=title_news],h2[class=title_news]</block_thumb_alt>
    <block_thumb_attribute></block_thumb_attribute>
    <detail_bodyhtml>div[class=fck_detail width_common block_ads_connect],div[class=block_content_slide_showdetail block_ads_connect],div[class=width_common space_bottom_20]</detail_bodyhtml>
    <detail_bodyhtml_remove>p a,p[style=text-align:right;],div[class=xemthem_new_ver],div[class=social_share],div[class=eclick_ad_holder ad_frame_protection],div[class=block_show_commen width_common]</detail_bodyhtml_remove>
    <detail_bodyhtml_replace></detail_bodyhtml_replace>
    <detail_bodyhtml_attribute></detail_bodyhtml_attribute>
    <detail_hometext>div[class=short_intro]</detail_hometext>
    <detail_hometext_remove></detail_hometext_remove>
    <detail_hometext_replace></detail_hometext_replace>
    <detail_author>p[style=text-align:right;]</detail_author>
    <detail_author_replace>a</detail_author_replace>
  </config>
 

Attachments

Lần sửa cuối: Bốn 26, 2017 lúc 12:30 PM
Thành viên năng động
Cảm ơn Bầu Đá rất nhiều. THật là tuyệt vời
 
Thích: songnhienkts
Thành viên mới
chân thành cảm ơn bác
 
Thành viên mới
em lây tin trang http://sohoa.vnexpress.net/ như bác hướng dẫn mà ko được.
Vnexpress_sô hóa
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
 
Thành viên quá tích cực
Quản trị viên
em lây tin trang http://sohoa.vnexpress.net/ như bác hướng dẫn mà ko được.
Vnexpress_sô hóa
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
hiện tại em ko vào dc trang vnexpress nên chưa xem được. Tuy nhiên nếu có báo lỗi mà ko kèm link thì ko sao cả vì vẫn lấy bình thường mà. Đợi truy cập dc vnexpress đã. Giờ vào nó cứ xoay vòng vòng @@
 
Thành viên quá tích cực
Quản trị viên
em lây tin trang http://sohoa.vnexpress.net/ như bác hướng dẫn mà ko được.
Vnexpress_sô hóa
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
Lỗi liên kết một bản tin
Không lấy được tiêu đề
Đã bỏ qua (một hoặc nhiều) tin
demo: http://bauda.nukeviet.store/lay-tin/so-hoa/
update mẫu tin bên trên nhé
 
Thành viên năng động
MÌnh gặp lỗi như hình.....mong bạn giúp đỡ....
 

Attachments

Thành viên mới
Ai cần lấy tin trang Vi En Ẹt Rét mà chưa lấy được thì tham khảo mẫu tin của mình xem sao nhé. Mình đã sử dụng cho site của mình để lấy tin các chuyên mục: xả hội , thế giới , kinh tế v.v... và mới test thêm mục thể thao tất cả đều ok.
Code:
<?xml version="1.0" encoding="UTF-8"?>
<config>
<title>Vnexpress</title>
<host_url>http://vnexpress.net</host_url>
<logo></logo>
<block_pattern>div[class=line_col_midnews_top] div[class=box_hot_news],div[class=line_col_midnews_top] div[class=box_sub_hot_news] li,div[class=block_mid_new] li</block_pattern>
<block_title>h1[class=title_news],h3[class=title_news]</block_title>
<block_title_remove>span[class=no_wrap],span[class=txt_num_comment]</block_title_remove>
<block_title_replace></block_title_replace>
<block_url>h1 a,h3 a</block_url>
<block_hometext>h4[class=news_lead],div[class=news_lead]</block_hometext>
<block_hometext_remove></block_hometext_remove>
<block_hometext_replace></block_hometext_replace>
<block_thumb>img</block_thumb>
<block_thumb_alt>h1[class=title_news],h3[class=title_news]</block_thumb_alt>
<block_thumb_attribute>src</block_thumb_attribute>
<detail_bodyhtml>div[class=fck_detail width_common block_ads_connect],div[class=block_content_slide_showdetail block_ads_connect],div[class=width_common space_bottom_20]</detail_bodyhtml>
<detail_bodyhtml_remove>p a,p[style=text-align:right;],div[class=xemthem_new_ver],div[class=social_share],div[class=eclick_ad_holder ad_frame_protection],div[class=block_show_commen width_common]</detail_bodyhtml_remove>
<detail_bodyhtml_replace>Xem thêm</detail_bodyhtml_replace>
<detail_bodyhtml_attribute></detail_bodyhtml_attribute>
<detail_hometext>h3[class=short_intro]</detail_hometext>
<detail_hometext_remove></detail_hometext_remove>
<detail_hometext_replace></detail_hometext_replace>
<detail_author>p[style=text-align:right;]</detail_author>
<detail_author_replace></detail_author_replace>
</config>
View attachment 1315
View attachment 1317
Những thông báo như: "ko lấy dc tiêu đề" và "Đã bỏ qua ...." mà ko kèm link liên kết thì đó là do cấu trúc nguồn có những phần giống nhau. Nó ko ảnh hưởng gì tới việc lấy bài viết về site của bạn.

Mẫu tin dành cho trang số hóa của VNExpress
Code:
<?xml version="1.0" encoding="UTF-8"?>
  <config>
    <title>Vnexpress2</title>
    <host_url>http://vnexpress.net/</host_url>
    <logo></logo>
    <block_pattern>div[class=box_hot_news],div[class=box_sub_hot_news] li,div[class=block_mid_new] li</block_pattern>
    <block_title>h1[class=title_news],h2[class=title_news]</block_title>
    <block_title_remove>span[class=no_wrap],span[class=icon_commend]</block_title_remove>
    <block_title_replace></block_title_replace>
    <block_url>a[class=txt_link]</block_url>
    <block_hometext></block_hometext>
    <block_hometext_remove></block_hometext_remove>
    <block_hometext_replace></block_hometext_replace>
    <block_thumb>a img</block_thumb>
    <block_thumb_alt>h1[class=title_news],h2[class=title_news]</block_thumb_alt>
    <block_thumb_attribute></block_thumb_attribute>
    <detail_bodyhtml>div[class=fck_detail width_common block_ads_connect],div[class=block_content_slide_showdetail block_ads_connect],div[class=width_common space_bottom_20]</detail_bodyhtml>
    <detail_bodyhtml_remove>p a,p[style=text-align:right;],div[class=xemthem_new_ver],div[class=social_share],div[class=eclick_ad_holder ad_frame_protection],div[class=block_show_commen width_common]</detail_bodyhtml_remove>
    <detail_bodyhtml_replace></detail_bodyhtml_replace>
    <detail_bodyhtml_attribute></detail_bodyhtml_attribute>
    <detail_hometext>div[class=short_intro]</detail_hometext>
    <detail_hometext_remove></detail_hometext_remove>
    <detail_hometext_replace></detail_hometext_replace>
    <detail_author>p[style=text-align:right;]</detail_author>
    <detail_author_replace>a</detail_author_replace>
  </config>
bác Bầu Đá cho e hỏi xíu. đoạn code bác đưa bỏ vào đâu vậy ạ. cám ơn bác
 
Thành viên mới
Cảm ơn bạn nhiều !