この記事では、生成モデルと判別モデルの違い、それらがどのように対比されるか、および互いに見ていきます。
判別機械学習は、可能な出力選択肢の中でリグ出力を認識することです。 データについて何かを与えられ、パラメータを学習することによって行われます。 これは、P(X,Y)の共同確率を最大化します。
分類は、さらに差別的モデリングとして言及されています。 これは、多くの場合、根拠にあります; モデルは、入力変数のインスタンスをクラス間で分離する必要があります。 指定されたインスタンスがどのクラスに属しているかに関して、選択または呼び出しを行う必要があります。
教師なしモデルは、入力変数の分布を要約します。 また、入力分布内で新しいインスタンスを作成または生成することに慣れていることができます。 このように、これらの多様なモデルは生成モデルとして観察される。
一つの変数は、ガウス分布のような既知のデータ分布を持つことができます。
生成モデルは、データ分布を要約することもできます。 これは、入力変数の分布に適合する新しい変数を生成するために使用されます。
生成設定内の簡単なモデルは、より少ない情報でなければなりません。 そして、差別的な設定の中で複雑なもの、そしてその逆の方法もあります。
これらの線に沿って、判別モデルは条件付き予測で生成モデルよりも優れています。 同様に、判別モデルは生成モデルよりも正則化する必要があります。p>
- 最初の例
- 別の例
- 生成モデルと判別モデルの数学的方程式とは何ですか?h2>
- 差別的および生成的な機械学習アルゴリズムの異なる種類は何ですか?
- What are the 次の質問は、それらを実行する前に尋ねる必要がありますか?h2> Unsplashのジョン-タイソンによる写真 どのモデルがトレーニングに必要なデータが少ないですか? どのモデルがデータを生成できますか? このような種類のモデルを使用する必要があるのはいつですか? どのモデルが極値に敏感ですか? どのモデルがオーバーフィットしやすいですか? どのモデルがより短い時間で訓練することができますか? どのモデルが条件付き確率を学習しますか? 不確実性の場合、どのモデルが優れていますか? 機能が関係を持っているとき、どのモデルが良いですか? 説明モデルが必要なときにどのモデルが良いですか? 必要な分類精度を最適化する場合、どのモデルが優れていますか? ラベル付けされたデータが利用できない場合、どのモデルが優れていますか? ラベル付けされたデータが利用可能な場合、どのモデルが優れていますか? どのモデルを実行するのが簡単で速いですか? ディープラーニングでは、生成的および差別的な働きはどのように機能しますか?h2> Unsplashの写真の趣味による写真
- 判別式分類器の欠点は何ですか?
- 結論
最初の例
たとえば、トニーとマークの二人の子供がいます。 どちらも猫と犬の違いを判断するためにペットショップを訪問しました。 両方とも、ペットの機能セットである色、サイズ、目の色、髪のサイズ、声に特別な注意を払います。
二つの写真は、マークするために猫の中で一つと犬の中で一つを持って、どちらがどちらであるか尋ねました。 マークはいくつかの条件を書き留めています。 声がニャーのように見え、目が青または緑の場合。それは茶色または黒の縞模様をしており、動物は猫かもしれません。
それは茶色または黒の縞模様をしています。
彼の単純なルールのために、彼はどちらが猫であり、どちらが犬である可能性があるかを検出しました。
今ではなく、トニー、白紙の二枚に二つの写真を表示し、猫と犬の外観がどのように見えるかを描くために彼に尋ねます。 トニーは絵を描く。
さて、どんな写真を与えられても、トニーはどちらが猫であるかを伝えるかもしれません。 どちらが犬かもしれませんが、彼が作成した図面をサポートしています。 描画は、検出のタスクのための時間のかかるタスクであり、それは猫である可能性があります。しかし、トニーとマークのために見える唯一のいくつかの犬や猫があった場合は、低いトレーニングデータを意味します。
そのような場合には、青い目の縞模様の茶色の犬の写真であれば。
マークがそれを猫のようなものにマークする機会があります。 トニーは彼女の絵を持っていますが、彼はこの写真が犬のものであることをよりよく検出することができます。トニーは、機能のようなより多くのものに耳を傾ける場合、それはより良いスケッチを作成します。
しかし、より多くの例がcatとdogのデータセットを使用していることを示す場合、MarkはTonyよりも優れています。マークは彼の観察に細心の注意を払っています。
マークは細心の注意を払っています。 あなたはより多くの機能を聞くために彼に尋ねるとします。 それはoverfittingと呼ばれるより複雑なルールを作成します。 したがって、猫と犬を見つける可能性は増加しますが、それはトニーでは起こりません。
ペットショップを訪問する前に、彼らは知らされていない場合はどうなりますか。 標識されたデータがないことを意味する動物の唯一の二種類があります。
マークは完全に失敗するだろうトニーはとにかくスケッチを描くことができるだろうが、彼は何を探すべきか分からないので。 これは大きな利点であり、半監督と呼ばれることもあります。
これは、Markが差別的で、Tonyが生成的であることを示しています。
別の例
差別的な機械学習は、実際にモデルを訓練しています。 可能な出力選択肢の中で正しい出力を区別する。 これは、条件付き確率P(Y|X)を最大化するモデルパラメータを学習することによって行われます。生成機械学習は、P(X、Y)の共同確率を最大化するパラメータを学習するためのモデルを訓練しています。
生成機械学習は、P(X、Y)の共同確率を最大化す
差別的および生成的な機械学習アルゴリズムの異なる種類は何ですか?
Discriminative models
- Logistic regression
- Random forests
- Support vector machine (SVM)
- Traditional neural networks
- Nearest neighbor
Generative Models
- Hidden Markov model (HMM)
- Naïve Bayes
- Bayesian Networks
- Gaussian mixture model (GMM)
What are the 次の質問は、それらを実行する前に尋ねる必要がありますか?h2>
Unsplashのジョン-タイソンによる写真
- どのモデルがトレーニングに必要なデータが少ないですか?
- どのモデルがデータを生成できますか?
- このような種類のモデルを使用する必要があるのはいつですか?
- どのモデルが極値に敏感ですか?
- どのモデルがオーバーフィットしやすいですか?
- どのモデルがより短い時間で訓練することができますか?
- どのモデルが条件付き確率を学習しますか?
- 不確実性の場合、どのモデルが優れていますか?
- 機能が関係を持っているとき、どのモデルが良いですか?
- 説明モデルが必要なときにどのモデルが良いですか?
- 必要な分類精度を最適化する場合、どのモデルが優れていますか?
- ラベル付けされたデータが利用できない場合、どのモデルが優れていますか?
- ラベル付けされたデータが利用可能な場合、どのモデルが優れていますか?
- どのモデルを実行するのが簡単で速いですか?
ディープラーニングでは、生成的および差別的な働きはどのように機能しますか?h2>
Unsplashの写真の趣味による写真
生成敵対ネットワーク(gan)では、生成器と判別器が一緒に訓練されました。 ジェネレータは、サンプルのバッチを生成します—これらは、実際のデータセットとともに、分類のために識別器に与えられます。
判別式分類器の欠点は何ですか?
It lacks the elegance of generative like priors, structure, uncertainty. Feel like black-boxes, relationships between variables don’t seem to be explicit and visualizable.
結論
生成的および判別的方法は、二つの広いアプローチです。 生成には、モデリングと判別的解分類が含まれます。 生成モデルはよりエレガントで、説明力があります。
モデルの豊かさは必ずしも逆さまではありません。 より多くのパラメータをフィッティングするには、より長く、より多くのスペース、およびより多くの計算が必要です。 判別モデルは、生成モデルよりも正則化する必要があります。
生成設定内の簡単なモデルは、判別設定内の高級なモデルよりも少ないデータを必要とします。