鍍金池/ 問答/人工智能  Python/ 用深度學(xué)習(xí)識(shí)別語種識(shí)別

用深度學(xué)習(xí)識(shí)別語種識(shí)別

現(xiàn)在需要實(shí)現(xiàn)這樣一個(gè)功能:

給出圖片,圖片中包含有文字,可能是漢字,可能是英語,也可能是其他文字。要做的事情是識(shí)別出該文字是何種語言,給出結(jié)果就行,對(duì)內(nèi)容識(shí)別的準(zhǔn)確度沒有要求。

現(xiàn)在我自己的思路是這樣的:

1.將原圖切割到規(guī)定大小
2.預(yù)處理:降噪,灰度化,二值化
3.劃分為訓(xùn)練集,驗(yàn)證集,測(cè)試集
4.構(gòu)建CNN開始訓(xùn)練模型

但是在第4步遇到了問題,不太知道該如何提取特征,另外數(shù)據(jù)集中圖片的大小不是固定的。

我想過用resize的方法,但是可能會(huì)丟失掉一些重要信息,會(huì)影響結(jié)果,所以想問一下有沒有什么辦法解決圖片大小不固定的問題。

希望能夠得到大家指點(diǎn),謝謝!

回答
編輯回答
愚念

cnn圖像的輸入就是rgb + 多個(gè)卷積核,cnn會(huì)自動(dòng)學(xué)習(xí)特征

2018年4月6日 15:23