Replace Pioneer Home   All Examples   Free Download

 New request --free  RSS: Replace Pioneer Examples

1324.Character encoding -- How to convert invalid charcters in csv file?

User: Michelle Lyles -- 2015-11-16          << 1323  1325 >>
Hits: 3180
Type: Character encoding   
Search all Character encoding examples
Description:
I have a product catalog in csv format.  The file contains 6000 rows and 94  
columns.  Column 16 (P) contains product description in html code.  The html  
code contains characters incompatible with my import tool (tool which imports  
products from csv to my website).  Can I use Replace Pioneer to convert html  
in column P to UTF8 code?
Input Sample:
<p>The Dogtra YS300 is a bark  
activated no-bark collar made for  
small to medium sized dogs. The  
sound recognition sensor uses a  
microprocessor to distinguish  
between the dog’s bark and the  
surrounding ambient noise. The YS300  
is fully waterproof and comes with a  
2-hour rapid charge battery and  
charger.<br></p><p><span  
style="font-weight: bold;">Package  
Contents:</span><br></p><ul><li>Bark  
Collar with collar strap</li> 
<li>Lithium Polymer Battery  
Charger</li><li>Owner's Manual</l
Output Sample:
UTF-8
Answer:
Hint: You need to Download and install "Replace Pioneer" on windows platform to finish following steps.
Sometimes if we use Excel to open csv file, we may get some invalid character like your examle. 
The reason may be: the csv file is UTF-8 encoded, but Excel could not correctly detect its encoding. The solution is convert UTF-8 file to UTF-8-BOM file, so that Excel can dectect it correctly. 
 
You can refer to following example for UTF8 to UTF8-BOM converting: 
http://www.mind-pioneer.com/services/698_Character_encoding.html 
 
If your tool's problem is similar to Excel, then this is the solution. 
 
If your tool still can not decode it correctly, you can try to convert the csv file from UTF8 to your local encoding such as byte/iso-8859-1. 
 
The encoding type is the properity of file, so you could not only change a part or column of file to some encoding.

Similar Examples:
Convert normal characters to html entity name (62%)
How to count how many characters in a web page? (62%)
How to remove/delete all multi-byte characters in a text file? (61%)
How to remove a string of characters from multiple filenames? (60%)
How to remove the first 10 characters of each line in text file? (60%)
How to remove/delete all single-byte characters in a text file (59%)
How to count how many word(non-symbol) characters in a text file? (59%)
How to remove some specified characters from multiple filenames? (58%)

Check Demo of Character encoding
Keywords:
iso 8859 1  detect  600  bom  utf8 bom  utf 8 bom  rope  iso  convert utf  similar  detect encoding type  detect file encoding  detect the encoding type of file  detect encoding file  detect encoding  detect encoding of file  detect encoding tool  detect the character encoding type