我真的希望有人花一点时间查看我的代码。我正在解析一些新闻内容,并且可以将初始解析插入到包含新闻URL和标题的数据库中。我想进一步扩展它,传递每个文章链接并分析文章的内容,并将其包含在我的数据库中。初始解析完全像这样工作:
<?php include_once ('connect_to_mysql.php'); include_once ('simple_html_dom.php'); $html = file_get_html('http://basket-planet.com/ru/'); $main = $html->find('div[class=mainBlock]', 0); $items = array(); foreach ($main->find('a') as $m){ $items[] = '("'.mysql_real_escape_string($m->plaintext).'", "'.mysql_real_escape_string($m->href).'")'; } $reverse = array_reverse($items); mysql_query ("INSERT IGNORE INTO basket_news (article, link) VALUES ".(implode(',', $reverse)).""); ?>
如您所见,我正在使用PHP Simple HTML DOM Parser。 为了扩展,我尝试使用mysqli语句来绑定参数,以便将所有html标记插入数据库。我之前使用XML解析完成了此操作。问题是我不知道如何绑定数组,看看我的代码是否正确,是否可以这样工作……这是整个代码:
<?php $mysqli = new mysqli("localhost", "root", "", "test"); $mysqli->query("SET NAMES 'utf8'"); include_once ('simple_html_dom.php'); $html = file_get_html('http://basket-planet.com/ru/'); //find main news $main = $html->find('div[class=mainBlock]', 0); $items = array(); foreach ($main->find('a') as $m){ $h = file_get_html('http://www.basket-planet.com'.$m->href.''); $article = $h->find('div[class=newsItem]'); //convert to string to be able to modify content $a = str_get_html(implode("\n", (array)$article)); if(isset($a->find('img'))){ foreach ($a->find('img') as $img){ $img->outertext = '';}} //get rid of images if(isset($a->find('a'))){ foreach ($a->find('a') as $link){ $link->href = 'javascript:;'; $link->target = '';}} //get rid of any javascript if(isset($a->find('iframe'))){ foreach ($a->find ('iframe') as $frame){ $frame->outertext = '';}} //get rid of iframes @$a->find('object', 0)->outertext = ''; @$a->find('object', 1)->outertext = ''; //modify some more to retrieve only text content //put entire content into a div (will if statements work here???) $text_content = '<div>'.$a.'<br>'. ($a->find('object', 0)->data > 0 ? '<a target="_blank" href="'.$a->find('object', 0)->data.'">Play Video</a> ') ($a->find('object', 1)->data > 0 ? '<a target="_blank" href="'.$a->find('object', 1)->data.'">Play Video</a> ') ($a->find('iframe[src*=youtube]', 0)->src > 0 ? '<a target="_blank" href="'.$a->find('iframe', 0)->src.'">Play Video</a> ') //couple more checks to see if video links are present .'</div>'; $items[] = '("'.$m->plaintext.'","'.$m->href.'","'.$text_content.'")'; } //reverse the array so the latest items have the last id $reverse = array_reverse($items); $stmt = $mysqli->prepare ("INSERT IGNORE INTO test_news (article, link, text_cont) VALUES (?,?,?)"); $stmt->bind_param ???; //(implode(',', $reverse)); $stmt->execute(); $stmt->close(); ?>
因此,逻辑适用于找到的文章的每个href,我将其传递来解析内容,然后尝试将其添加到数组中。我可能有很多错误,但是我无法测试它,因为我不知道如何绑定它以查看它是否有效。而且我也不确定是否可以在$ text_content div中执行if语句…,如果存在,则表示显示“播放视频”。因此,如果有人能抽出时间与我一起解决这个问题,我将非常感激。
更新:将if语句更改为$ text_content div中的比较运算符。
这正是mysqli确实很尴尬的情况。要绑定多个参数,必须将它们作为一个可变长度参数列表传递给mysql-> bind_param(),但棘手的部分是必须 通过引用 绑定它们。PHP中的引用可能会造成混乱。
这是一个粗糙的示例(尽管我尚未测试此确切的代码):
$stmt = $mysqli->prepare("INSERT IGNORE INTO test_news (article, link, text_cont) VALUES (?,?,?)"); foreach ($reverse as &$value) { $params[] = &$value; } array_unshift(str_repeat('s', count($params))); call_user_func_array(array($stmt, 'bind_param'), $params);
当我想编写将参数绑定到SQL的通用函数时,我发现使用PDO容易得多。无需绑定,只需将值数组传递给PDOStatement :: execute()方法。
$stmt = $pdo->prepare("INSERT IGNORE INTO test_news (article, link, text_cont) VALUES (?,?,?)"); $stmt->execute($reverse);
更新:如果您需要$ items包含多行数据,我可以这样做:
首先,在构建$ items时,使其成为数组数组,而不是将值串联在一起:
foreach ($main->find('a') as $m){ $items[] = array($m->plaintext, $m->href, $text_content); }
然后准备一个插入一行的INSERT语句,并遍历$ items为每个元组执行一次准备好的语句:
$stmt = $pdo->prepare("INSERT INTO test_news (article, link, text_cont) VALUES (?,?,?)"); foreach ($items as $tuple) { $stmt->execute($tuple); }
我根本不知道您为什么要使用array_reverse(),也不知道您为什么要使用INSERT IGNORE,所以我省略了这些。