Ai thạo JavaScript cho mình hỏi cái:
Mình đang sửa template cho vietnamnet, gỡ bỏ phần tin liên quan không cần thiết đi. Tuy nhiên do bố cục trang tin của vietnamnet không thống nhất (để ở cuối, ở giữa tin) do đó mình dùng RegEx để xử lý.
Mình dùng chuỗi regex sau để bỏ table Tin liên quan đi:
var d = new Document(article.url);
var body = d.getElementsByAttr("TD","class","text")[0].innerHTML;
//body = body.outerHTML.slice(0, body.outerHTML.indexOf('<table class="rl center">'));
//<table\sclass=[\d\D]*?</table>
var reg = new RegExp("<table\\sclass=[\\d\\D]*?</table>", "g");
var ret = reg.exec(body);
log("====== R E T 0 = " + ret[0]);
body = body.replace(ret[0].outerHTML, "");
article.body = body;
Mặc dù xem log đã lấy ra được chính xác đoạn mình cần cắt nhưng chức năng replace hoạt động không chính xác, không cắt đi được.