欧美色视频免费_2018亚洲男人天堂_好骚综合在线_久久久久久久久国产_日韩精品久久久久久久九岛_国产成年人视频

推廣 熱搜: 廣場  Java  app  Word  營業(yè)  微信公眾號  北京代理記賬  商城  代理記賬  商標(biāo)交易 

一小時徒手從0到1搭建一套圖片文字識別的OCR平臺

   2024-07-04 轉(zhuǎn)載網(wǎng)絡(luò)4180
核心提示:(2)面向程序;在編碼的過程中,需要實現(xiàn)自動識別圖片中的文字功能,常見有供應(yīng)商有阿里的OCR文字識別、百度的OCR文字識別等等,當(dāng)然也可以自己使用Tesseract搭建一套圖片文字識別的服務(wù)。下面我們將使用Tesseract搭建一套自己的圖

在我們?nèi)粘5墓ぷ鲗W(xué)習(xí)中,圖片中的文件識別功能是非常常用的(如用戶上傳的圖片做風(fēng)控)。我們根據(jù)面向的對象不同,一般可以分成兩類:

(1)面向普通用戶;現(xiàn)有的圖片文件識別工具有很多,常見有的微信截圖工具中的自帶的文字識別功能、專業(yè)OCR文字識別軟件(如AI識別王、迅捷OCR識別軟件);

(2)面向程序;在編碼的過程中,需要實現(xiàn)自動識別圖片中的文字功能,常見有供應(yīng)商有阿里的OCR文字識別、百度的OCR文字識別等等,當(dāng)然也可以自己使用搭建一套圖片文字識別的服務(wù)。

下面我們將使用搭建一套自己的圖片文字識別的服務(wù)平臺。本平臺中使用的技術(shù)有: + + + + 。

是一個開源的光學(xué)字符識別(OCR)引擎,是一個基于 OCR引擎的Java接口。

1、-OCR環(huán)境搭建

(1)基礎(chǔ)依賴安裝

放在上搭建的,以下是搭建的如下:

#1、基礎(chǔ)依賴yum -y install gcc-c++ makeyum install -y autoconf automake libtool libjpeg libpng libtiff zlib libjpeg-devel libpng-devel libtiff-devel zlib-devel
#2、下載pkg-configwget https://pkg-config.freedesktop.org/releases/pkg-config-0.29.tar.gz#解壓tar -zxvf pkg-config-0.29.tar.gz#編譯cd pkg-config-0.29/ ./configure --with-internal-glibmakemake checkmake install

完成基礎(chǔ)依賴安裝后可以看到

文件下載網(wǎng)站搭建_搭建一個下載網(wǎng)站_搭建下載網(wǎng)站的軟件

(2)上傳的壓縮包和相關(guān)的文件

搭建下載網(wǎng)站的軟件_搭建一個下載網(wǎng)站_文件下載網(wǎng)站搭建

依賴可以到官方網(wǎng)站下載(我這里下載好,直接可以使用,需要的軟件的可以私信我)

上傳文件到上

(3)安裝

#1、解壓文件tar -zxvf leptonica-1.79.0.tar.gz#2、編譯./autogen.sh./configure --prefix=/usr/local/makemake install

編譯完成之后的效果:

搭建下載網(wǎng)站的軟件_搭建一個下載網(wǎng)站_文件下載網(wǎng)站搭建

配置:

vi /etc/profile-----------------添加配置------------------------export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/libexport LIBLEPT_HEADERSDIR=/usr/local/includeexport PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
#刷新生效source /etc/profile

(4)安裝

#1、解壓文件tar?-zxvf?tesseract-1.1.tar.gz#2、編譯./autogen.sh./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/includemakemake?install

編譯之后的效果:

文件下載網(wǎng)站搭建_搭建下載網(wǎng)站的軟件_搭建一個下載網(wǎng)站

(5)測試安裝是否成功

tesseract --version

安裝成功的效果:

搭建一個下載網(wǎng)站_搭建下載網(wǎng)站的軟件_文件下載網(wǎng)站搭建

(6)語言庫放到-OCR指定的目錄中

搭建下載網(wǎng)站的軟件_搭建一個下載網(wǎng)站_文件下載網(wǎng)站搭建

將這兩個文件放在/usr///文件夾下

以上就完成了-OCR基礎(chǔ)環(huán)境的搭建。在這個過程中可能出現(xiàn)如下的問題:

configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.

問題的原因是沒有安裝pkg-。

2、搭建-OCR平臺服務(wù)

(1)搭建基礎(chǔ)的工程(不詳細(xì)介紹)

(2)添加依賴

<dependency>    <groupId>net.sourceforge.tess4jgroupId>    <artifactId>tess4jartifactId>    <version>4.5.4version>dependency>

(3)配置yml文件

server:  port: 8081
#指定識別語言庫的位置tess4j: datapath: /usr/local/share/tessdata

(4)配置

@Configurationpublic class TesseractOcrConfig {    @Value("${tess4j.datapath}")    private String dataPath;
@Bean public Tesseract tesseract() {
Tesseract tesseract = new Tesseract(); //設(shè)置數(shù)據(jù)文件夾路徑 tesseract.setDatapath(dataPath); //設(shè)置為中文簡體 tesseract.setLanguage("chi_sim"); return tesseract; }
}

(5)編寫識別的圖片的服務(wù)

@Service@Slf4jpublic class OcrService {
@Resource private Tesseract tesseract;
public String recognizeText(MultipartFile imageFile) throws IOException, TesseractException { // 轉(zhuǎn)換 InputStream sbs = new ByteArrayInputStream(imageFile.getBytes()); BufferedImage bufferedImage = ImageIO.read(sbs);
// 對圖片進(jìn)行文字識別 return tesseract.doOCR(bufferedImage); }}

(6)編寫識別的圖片的服務(wù)

@RestController@RequestMapping("/api")@Slf4j@Api(description = "OCR服務(wù)")public class OcrController {
@Resource private OcrService ocrService;
@PostMapping(value = "/recognize") public String recognizeImage(@RequestParam("file") MultipartFile file) throws TesseractException, IOException { // 調(diào)用OcrService中的方法進(jìn)行文字識別 String result = ocrService.recognizeText(file); log.info("識別圖片的結(jié)果:{}", result);
return result; }}

(7)本平臺就不寫頁面了,直接使用展示效果,配置

#1、添加依賴        io.springfox??????springfox-swagger2??????2.7.0???          io.springfox???????springfox-swagger-ui???????2.7.0      #2、配置swagger@Configuration@EnableSwagger2public class SwaggerConfig {
@Bean public Docket webApiConfig(){ System.out.println("啟動swagger"); return new Docket(documentationType.SWAGGER_2) .groupName("webApi") .apiInfo(webApiInfo()) .select() //接口中由/admin /error就不顯示 .paths(Predicates.not(PathSelectors.regex("/admin/.*"))) .paths(Predicates.not(PathSelectors.regex("/error.*"))) //掃描指定的包????????????????.apis(RequestHandlerSelectors.basePackage("com")) .build(); }
private ApiInfo webApiInfo(){ return new ApiInfoBuilder() .title("OCR-API文檔") //swagger頁面上大標(biāo)題 .description("OCR微服務(wù)接口定義") //描述 .version("1.0") .contact(new Contact("java", "http://baidu.com", "1733150517@qq.com")) .build(); }}

搭建完成之后的整體項目架構(gòu):

搭建下載網(wǎng)站的軟件_文件下載網(wǎng)站搭建_搭建一個下載網(wǎng)站

3、測試搭建的 OCR平臺

(1)上傳服務(wù)的jar包到了上

(2)啟動項目(需要預(yù)先安裝jdk和)

java -jar ocr-test-1.0-SNAPSHOT.jar

啟動成功的效果:

搭建下載網(wǎng)站的軟件_文件下載網(wǎng)站搭建_搭建一個下載網(wǎng)站

(3)啟動(:port/-ui.html)

搭建一個下載網(wǎng)站_搭建下載網(wǎng)站的軟件_文件下載網(wǎng)站搭建

至此整個平臺就搭建完成。

下面進(jìn)行圖片測試:

文件下載網(wǎng)站搭建_搭建下載網(wǎng)站的軟件_搭建一個下載網(wǎng)站

后端打印的日志:

搭建一個下載網(wǎng)站_搭建下載網(wǎng)站的軟件_文件下載網(wǎng)站搭建

我們的圖片文字識別的平臺就搭建好了。

 
反對 0舉報 0 收藏 0 打賞 0評論 0
 
更多>同類資訊
推薦圖文
推薦資訊
點擊排行
合作伙伴
網(wǎng)站首頁  |  關(guān)于我們  |  聯(lián)系方式  |  使用協(xié)議  |  版權(quán)隱私  |  網(wǎng)站地圖  |  排名推廣  |  廣告服務(wù)  |  積分換禮  |  網(wǎng)站留言  |  RSS訂閱  |  違規(guī)舉報  |  冀ICP備2023006999號-8
 
主站蜘蛛池模板: 日韩中文字幕在线视频 | 日韩综合一区 | 久久y | 美日韩毛片 | 色婷婷综合久久久 | 免费a视频 | 麻豆一二三区 | 国产在线看片 | 亚洲专区视频 | 精品视频在线看 | 亚洲草草 | 国产精品久久久久久久久久久久 | 国产理论片 | 黄色片网站免费 | 激情毛片| 亚洲精品久 | 看全色黄大色黄女片18女人 | 国产视频二区在线 | 国产精品久久一区二区三区 | aaaaaa视频 | 国产一区二区三区在线免费观看 | 久久久国产精品 | 国产欧美日本在线 | 久久综合站 | 国产呦精品一区二区三区网站 | 免费在线成人 | 亚洲成人国产 | 九九热免费在线视频 | 中文字幕 亚洲视频 | 日韩成人免费在线 | 男女污污 | 欧美日韩无 | 成人精品国产 | 国产精品久久久久久久午夜片 | 99这里只有精品 | 99久久国| 在线播放国产一区二区三区 | 欧美日韩黄色大片 | 伊人成人在线视频 | 国产日韩av在线播放 | 日韩不卡在线 |