Replace Pioneer Home   All Examples   Free Download

 New request --free  RSS: Replace Pioneer Examples

850.Text file parser -- How to extract company name ended with "co ltd" from many website?

User: bruce lee -- 2011-09-06          << 849  851 >>
Hits: 3175
Type: Text file parser   
Search all Text file parser examples
Description:
How to extract company name from many website?I find the company name usually end up with "co., ltd" and the first letter of every word is capital.For example,Hebei Shulin Chemicals CO.,Ltd.  
How to extract a group words with "co ltd" and the first letter of every word is capital?
Input Sample:
www.shlchem.com 
www.shlchem.com 
www.shlchem.com
Output Sample:
www.shlchem.com  Hebei Shulin Chemicals CO.,Ltd 
www.shlchem.com  Hebei Shulin Chemicals CO.,Ltd 
www.shlchem.com  Hebei Shulin Chemicals CO.,Ltd
Answer:
Hint: You need to Download and install "Replace Pioneer" on windows platform to finish following steps.
1. prepare a file links.txt that contains one link each line starting with "http"  
2. open "Tools->Batch Runner" menu, click "import list" to import the links.txt 
3. double click one line of address open "File Name Editor" window, change "Download As" to "text", and check "Apply to All", click "ok" 
4. click "Fast Replace" to open "Fast Replace" window 
5. click "Add" to add a rule 
* set "search" to the string you want to match, such as: 
 
* set "replace" to: 
 
click "ok" 
6. make sure "ignore case", "reg exp" and "extract" option are checked. 
7. click "Start", and select "output to single file" button, all text that matches specified pattern will be extracted to a single file.

Screenshot 1:  Fast_Replace_Window


Similar Examples:
How to extract text enclosed by "body" tag from many html files and join together? (58%)
How to extract all emails from many webs with depth 2? (57%)
How to extract all image links from a list of webpages? (56%)
How to extract multiple lines in specified order from many text files? (54%)
How to extract all text enclosed by H1 tag from multiple html files? (53%)
How to extract all distinct parent folder names from a list of files? (53%)
How to extract all lines with numbers from many text files? (53%)
How to extract all text that enclosed by <a> and <font>? (51%)

Check Demo of Text file parser
Keywords:
company name ended with co ltd  capital  cap  editor  line starting with  starting with  starting  first letter  matches  website  search capital case  extract company name from text  text extract company name  co company first letter capital  find and replace first word capital  find and replace website  extract string from 1 line  change first word every line