+ Site: là 1 tên để chúng ta định nghĩa để lấy nội dung về, anh/chị đặt site là gì thì ở cấu hình Danh sách tài khoản phải điền đúng tên site, lưu ý không được viết dấu tiếng việt
+ FindAll=div|data-boxtype|timelineposition có nghĩa là: Phần mềm sẽ lấy toàn bộ thẻ div có data-boxtype tên là timelineposition
+ Link=0|href|http://dantri.com.vn có nghĩa là: lấy thẻ đầu tiên là 0 và thuộc tính href và thêm http://dantri.com.vn vào đầu thì sẽ lấy được link cần lấy tin
+ Title=0|title có nghĩa: lấy thẻ đầu tiên là 0 và thuộc tính title
+Link=http://search.dantri.com.vn/SearchResult.aspx?s={KeywordA}&PageIndex={Page} có nghĩa là lấy toàn bộ các link tìm kiếm ở trên trang dantri khi gõ vào ô tìm kiếm của dantri.com.vn để tìm kiếm theo keywordA là từ khóa cần tìm ở ảnh 1. ví dụ ảnh dưới minh họa là mình tìm kiếm từ phần mềm
+ Page=1-100 lấy từ trang 1 tới trang thứ 100
+ LinkC=dantri.com.vn/|.htm có nghĩa là Link lây phải chứa các từ : dantri.com.vn/ hoặc .htm
+ LinkNC=/video/|/su-kien/|/the-gioi/|/phap-luat/|/tam-long-nhan-ai/|/xa-hoi/ có nghĩa là Link lây phải không chứa các từ /video/ hoặc /sukien/..
+ Description=1,1|text lấy thẻ a và nội dung text
+ C=OK phần mềm sẽ thực hiện câu lệnh lấy nội dung html trên web
+ Find=div|id|divNewsContent: có nghĩa là lấy nội dung của thẻ div có id là divNewsContent
Muốn xem html thì chúng ta vào trình duyệt và view html lên
vị trí các thẻ như sau:
<a>
<a1><a11></a11></a1>
<a2><a21></a21><a22></a22></a2>
</a>
0 là thẻ a1
0,0 là thẻ a11
1,0 la the a21
1,1 la the a22