blog

BERT~、今後のコア技術

2020.01.27 2022.04.11

BERT（ Bidirectional Encoder Representations from Transformers）

Google AI 双方向Transformer で言語モデルを事前学習することで汎用性を獲得し、転移学習させると、８つのベンチマークタスクでSOTAを達成。

様々な種類の自然言語処理に対して汎用的に使える自然言語処理モデルです。 BERTは事前学習モデルであり事前学習したモデルを既存のタスク実行モデルに合成することで、そのモデルの精度を向上させることができます。

この合成する作業をファインチューニング と呼びます。

(State of the Art: 現在最も優れている手法）

ACL/NACCL/EMNLP といった海外の主要な自然言語処理に関する国際会議でも非常に頻繁に取り上げており、更にさまざまタスクでベンチマークを超え続けています。

　 BERT で転移学習したモデルは、少ないデータを追加学習するのみで動作するので、モデル作成の手間が大幅削減されます。また、 BERT はネット上に大量にあるデータを用いて事前学習を行うため、自前で大量データを作成する必要がないという点でも優秀です。　例えば、 Wikipedia の記事や SNS の書込みから事前学習をすることができます。　 BERT は 2018 年 11 月に Google より発表されました。

kNN法（K近傍法　k Network Neighbor）とk-means法（教師なしの手法）は目的が全然違う

RNN（Recurrent Neural Network）時系列データを扱うニューラルネットワーク＝音声データ

主に動作確認用。いろいろ実験＆ひとりごと

BERT~、今後のコア技術

コメント

関連記事

Archive

サックス運指

カタカナにする文字起こし

厄年・九曜星

単に数字を置換するだけ（月）

『crysti32.ocx』またはその依存関係のひとつが適切に登録されていません。

改行コードを消す！には

ペーストした画像をワードプレスに投稿する⇒プラグイン不要

Lineのスタンプ

VisualStudio2023 コントロールのプロパティが表示されない