词汇量的日文
例句与用法
- そのため語彙サイズのセットが小さい程(カバー率が小さい程),パープレキシティは小さくなるということになり好ましくない
由此会出现词汇量的set越小(覆盖率越小),复杂度越小的情况。然而这是我们所不愿看到的 - よって現在のシステム用の辞書の収録語数は表4の36,102語に人手で登録した単語を加えた36,445語である
因此,用于现在系统的词典中收录的词汇量是表4中的36102个词加上人工写入的单词共计36445个单词 - とえば上位約25,000個(種類)の単語で全トークンの約95%がカバーでき,取り扱いが可能な語彙数であることがわかる
例如,用上位的约25,000个(种类)的词就能覆盖文本全部表达字符的约95%,说明这些就是可以使用的词汇量。 - しかし,この手法ではよほど語彙量の多い,かつ多種の言語資料を対象にしない限り,資料による語彙や語の使用率の偏りは避け難い.
但是,这种手法词汇量太多,而且如果不以多种语言资料为对象,则很难避免资料中的词汇和词语使用率的偏颇现象。 - また,定型表現5000個追加のものの方が,定型表現2000個追加のものと比べて,語彙サイズが大きいのにも関わらず,パープレキシティが減少している
追加5000个定型表达的跟追加2000个定型表达的,虽然词汇量大了,但复杂度却减少了 - 実環境における大語彙連続音声認識においては,ユーザの発声の特徴に適応する話者適応技術および雑音環境に適応する環境適応技術が求められる.
在实际环境中,大词汇量连续声音识别需要适应用户发声特征的说话者适应技术以及适应杂音环境的环境适应技术。 - しかし,最近の大語彙音声認識に用いられる形態素数は20000以上で,また第2パスに言語モデルとしてtrigramを使用するのが主流となりつつある
但最近的大词汇量语音识别中使用的词素数在20000以上,且第二段将trigram作为语言模型正成为主流 - 大語彙ないしタスク非依存のシステムのための統計的言語モデルとして今日もっとも有望視されているものに,@equation_0@―gramが挙げられる
统计语言模型是为大词汇量或非依存性任务系统而设计的,现在性能最好的是@equation_0@―gram。 - CMU SLM Toolkitを用いてトレーニングデータから,語彙サイズ20000の辞書を作成し,bigram,trigram言語モデルを構築する
采用CMU SLM Toolkit从训练数据中制作词汇量20000词典,构筑bigram,trigram语言模型 - 本論文では主として言語処理上の観点からこの単語単位N―gramモデルを考察し,必要な語彙数,コーパスの量とパープレキシティの関係を明らかにする
本论文主要从语言处理的观点来考察这种词单位N―gram模型,并阐明了必要的词汇量、语料库的量及用于识别单词终端的平均接续词汇量的关系。
词汇量的日文翻译,词汇量日文怎么说,怎么用日语翻译词汇量,词汇量的日文意思,詞匯量的日文,词汇量 meaning in Japanese,詞匯量的日文,发音,例句,用法和解释由查查日语词典提供,版权所有违者必究。