我正在修复一些错误的UTF-8编码。我目前正在使用PHP 5和MySQL。
在我的数据库中,我有一些编码错误的实例,例如:ƒ
我需要某种函数来帮助我将ƒ,®,?,?¼和其他类似的实例映射到其适当的带重音的UTF-8字符。
过去,我不得不尝试“修复”许多UTF8损坏的情况,但是不幸的是,这绝非易事,而且常常是不可能的。
除非您能确切确定它是如何破裂的,而且总是以完全相同的方式破裂,否则将很难“消除”损坏。
如果要尝试消除损害,最好的选择是开始编写一些示例代码,在该示例中,尝试对mb_convert_encoding()的调用进行多种变体,以查看是否可以找到“ from”和“ to”的组合修复您的数据。最后,通常最好不要再因为涉及到痛苦的程度而担心修复旧数据,而只是去解决将来的问题。
但是,在执行此操作之前,您需要确保首先解决导致此问题的所有问题。您已经提到数据库表排序规则和编辑器设置正确。但是,还有更多地方需要检查以确保所有内容都正确地是UTF-8:
如果您错过了整个过程中的任何一步,则编码可能会被破坏并且会出现问题。一旦您进入执行utf-8的“槽”,这一切便成为第二天性。当然,PHP6应该是来自getgo的完全unicode投诉,这将使很多事情变得更容易(希望如此)