我正在尝试重写一个旧网站。 它是波斯语,使用波斯/阿拉伯字符。
CREATE DATABASE `db` DEFAULT CHARACTER SET utf8 COLLATE utf8_persian_ci; USE `db`;
几乎所有我的表/列COLLATE都设置为 utf8_persian_ci
utf8_persian_ci
我正在为我的新脚本使用codeigniter,我有
'char_set' => 'utf8', 'dbcollat' => 'utf8_persian_ci',
在数据库设置中,因此没有问题。
所以这是奇怪的部分
旧的脚本正在使用某种称为TUBADBENGINE或TUBA DB ENGINE… 的数据库引擎,没什么特别的。
TUBADBENGINE
TUBA DB ENGINE
当我使用旧脚本在波斯语数据库中输入某些数据时,当我查看数据库时,字符存储为عمران 。
عمران
旧脚本获取/显示该数据很好,但是新脚本显示它们具有与数据库相同的奇怪字体/字符集
因此,当我输入时اااا,数据库存储的数据看起来像是عمراÙ,当我在新脚本中获取数据عمراÙ但在旧脚本中获取数据时, اااا
اااا
عمراÙ
CREATE TABLE IF NOT EXISTS `tnewsgroups` ( `ID` int(11) NOT NULL AUTO_INCREMENT, `fName` varchar(200) COLLATE utf8_persian_ci DEFAULT NULL, PRIMARY KEY (`ID`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_persian_ci AUTO_INCREMENT=11 ; -- -- Dumping data for table `tnewsgroups` -- INSERT INTO `tnewsgroups` (`ID`, `fName`) VALUES (1, 'عمران'), (2, 'معماری'), (3, 'برق'), (4, 'مکانیک'), (5, 'test'), (6, 'test2');
另一方面,当我ااااا直接输入数据库时
ااااا
当然我有相同的اااا存储在数据库中
新脚本显示得很好
但是在旧脚本中我得到了 ????
????
任何人都可以理解吗?
这是大号引擎
https://github.com/maxxxir/mz-codeigniter- crud/blob/master/tuba.php
旧脚本的用法示例:
define("database_type" , "MYSQL"); define("database_ip" , "localhost"); define("database_un" , "root"); define("database_pw" , ""); define("database_name" , "nezam2"); define("database_connectionstring" , ""); $db = new TUBADBENGINE(database_type , database_ip , database_un , database_pw , database_name , database_connectionstring); $db->Select("SELECT * FROM tnews limit 3"); if ($db->Lasterror() != "") { echo "<B><Font color=red>ÎØÇ ! áØÝÇ ãÌÏøÏÇ ÊáÇÔ ˜äíÏ"; exit(); } for ($i = 0 ; $i < $db->Count() ; $i++) { $row = $db->Next(); var_dump($row); }
简而言之,因为这已经被讨论了上千次了:
"漢字"
E6 BC A2 E5 AD 97
latin1
æ¼¢å
因此,这里的问题是,当将数据输入数据库时,数据库连接设置不正确。您必须将数据库中的数据转换为正确的字符。尝试这个:
SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name
utf8尝试一下,也许这不是您所需要的。如果可行,UPDATE请将其更改为语句以永久更新数据。
utf8
UPDATE