今天小編給大家帶來一款功能強大的批量文本提取器,該軟件非常不錯,當前支持支持正則表達式批量提取文本中的網址,批量提取文本,可以將HTML等文件中指定內容存入數據庫、HTML、文本文件,存入數據庫的意思是將提取的文本內容直接導入進數據庫中。
批量文本提取器功能:
提供多種查找、獲取信息的方式:
提取文件中全部email郵件地址
提取文件中全部互聯網址(無參數)
提取文件中全部互聯網址(帶參數)
提取HTML文件中body的文本內容
提取HTML文件中title和body的文本內容
提取HTML文件中的文本內容
提取HTML網頁的顯示文本內容
提取DOC/RTF等文件中全部文本內容
提取DOC/RTF等文件中全部文本內容(自動分析標題)
并可自定義正則表達式獲取信息
支持從其它網站直接提取文本內容,生成所需數據庫文件
支持/UTF-8多種編碼
可將提取信息生成文本文件、HTM網頁文件、MDB數據庫文件
可設置提取文件的間隔,免除下載網頁過快,服務器不響應
批量文本提取器特點:
提供豐富的格式化設置:首字母大寫,全部小寫,全部大寫,文件名小寫,文件名大寫,擴展名小寫,擴展名大寫,轉換大小寫,轉換成為全角字符,轉換成為半角字符,刪除中文字符,刪除英文字符,刪除數字字符,拼音:首字母大寫,拼音:下劃線分隔,拼音:數字聲調,簡體轉繁體,繁體轉簡體批量提取文本中的網址,加入路徑。