构建简单的AI .NET库 - 第4部分 - 超越感知器

Gamil Yassin

5.00/5 (13投票s)

2017年9月17日

CPOL

9分钟阅读

17726

本系列文章的第4部分，从头开始演示.NET AI库

系列介绍

这是创建.NET库的第4篇文章。以下是本系列之前文章的链接

我的目标是创建一个简单的AI库，涵盖几个高级AI主题，如遗传算法、ANN、模糊逻辑和其他进化算法。完成此系列文章的唯一挑战是是否有足够的时间来处理代码和文章。

代码本身可能不是主要目标，然而，理解这些算法才是。希望它有一天能对某人有所帮助。

文章介绍 - 第2部分“超越感知器”

在上一篇文章中，我们创建了一个充当二元线性分类器的感知器。我们将继续讨论感知器，以创建更复杂的布局来解决更复杂的问题。

我强烈建议您在继续阅读本文之前，先回顾一下《构建简单的AI .NET库 - 第2部分 - 机器学习入门》。

使用感知器优化二元函数

为了更好地理解感知器及其局限性，我们将检查它在优化二元函数（如NOT、OR、AND和XOR）中的应用。

NOT 函数

这是一个1维问题。让我们设计如下感知器

h(x) = W₀ + W₁ * X₁

由于输出是0或1，步进激活函数是一个不错的选择。

然后 Y=StepFunction (h(x))

从上面的NOT真值表可以看出，当X为0时，输出Y为1，所以当X=0时，h(x)应该>= 0。

h(x) = W₀ + W₁ * X₁ >= 0 当 X=0

对于 X =0，W₀ >= 0，让我们选择W₀ =1

h(x) = 1 + W₁ * X₁

现在，当 X = 1 时，Y 的第二个可能值为 0

h(x) < 0 当 X =1

1 + W₁ * X₁ < 0 当 X =1

1 + W₁ < 0 当 X=1

W₁ < -1，所以让我们选择W₁ = -1.5

最后，h(x) = 1 - 1.5 * X

OR 函数

这是一个2维问题，我们来绘制X1和X2。

这些是线性可分的组，可以画一条直线将两组分开，如下所示

同样，我们将为这个感知器使用步进激活函数

h(x) = W₀ + W₁ * X₁ + W₂ * X₂

Y= Step(h(x)

从真值表可知，当X1=X2=0时，Y=0，这意味着

h(x) < 0 当 X1=X2=0

当 X1=X2=0 时，W0 < 0，让我们选择W0为 -0.5

h(x) = -0.5 + W₁ * X₁ + W₂ * X₂

从图中选择一条线，该线在X1处截距为0.5，在X2处截距为0.5（其他线也可以作为分隔线）

根据真值表，当X1=1且X2=0时，Y=1，则当X1=1且X2=0时，h(x) >= 0

-0.5+ W₁ * X₁ + W₂ * X₂ >= 0 当 X1=1 且 X2 =0

-0.5+ W₁ * 1 + W₂ * 0 >= 0 当 X1=1 且 X2 =0

-0.5+ W₁ >= 0 当 X1=1 且 X2 =0

当 X1=1 且 X2 =0 时，W₁ >= 0.5，让我们选择W₁ = 1

h(x) = -0.5 + 1 * X₁ + W₂ * X₂

同样，当X1=0且X2=1时，Y=1，则当X1=0且X2=1时，h(x) >= 0

-0.5 + 1 * X₁ + W₂ * X₂ >= 0 当 X1=0 且 X2 =1

-0.5 + W₂ >= 0 当 X1=0 且 X2 =1

当 X1=0 且 X2 =1 时，W₂ >= 0.5，让我们选择W2 = 1

最后h(x) = -0.5 + X1 + X2

让我们确认真值表

X1	X2	期望值	h(x) = -0.5 + X₁+ X₂	Y
1	1	1	1.5	1
1	0	1	0.5	1
0	1	1	0.5	1
0	0	0	-0.5	0

AND 函数

类似地，这是一个2D问题，感知器应为

通过遵循上述OR过程，我们可以得出W0、W1和W2的值

一种可能的组合是h(x) = -1.5 + X1 + X2

验证真值表

X1	X2	期望值	h(x) = -1.5 + X₁+ X₂	Y
1	1	1	0.5	1
1	0	0	-0.5	0
0	1	0	-0.5	0
0	0	0	-1.5	0

所以，最终的感知器应为

XOR 函数

这是一个问题，该函数无法线性分离；没有一条直线可以分离这两个组。

那么感知器就无法解决这个问题，这是感知器的主要局限性（仅限于二元线性分类）。

然而，感知器是一种强大的算法，也许可以在其他形式中使用来优化复杂的问题。

让我们回到XOR函数，并尝试更深入地理解它。我们将使用文氏图来帮助我们。文氏图是不同逻辑运算的图形表示（文氏图的更多信息）。

OR门的文氏图应为

这是AND的文氏图

这是XOR

从文氏图可以看出，XOR门的含义是UNION（OR）的结果，排除INTERSECTION区域，换句话说

A XOR B = (A + B) - (A.B)

我们已经在上面使用感知器实现了AND和OR函数，那么为什么不使用多个感知器来实现上述函数呢？一种可能的实现方式是

AND 函数

2D AND函数已经实现，我们可以使用它

OR 函数

我们还没有实现3D OR函数。为了做到这一点，让我们先简化XOR函数的真值表

X1	X2	X1 AND X2	期望值
1	1	1	0
1	0	0	1
0	1	0	1
0	0	0	0

所以我们需要找到OR函数感知器h(x)的权重，以满足上表，其中

h(x) = W₀ +W₁ * X₁ + W₂ * X₂ + W₃ * X₃ (X3 = X1 AND X2)

激活函数也将是步进函数。

让我们从X1=0, X2=0 & X1 AND X2 = 0的最后一个组合开始，则Y = 0

h(x) = W₀ +W₁ * X₁ + W₂ * X₂ + W₃ * X₃ <0 当 X1=0, X2=0 & X1 AND X2 = 0

当 X1=0, X2=0 & X1 AND X2 = 0 时，W₀ <0，让我们选择W₀ = -1

对于X1=1, X2=0 & X1 AND X2 = 0 的组合，则Y = 1

h(x) = -1 +W₁ * X₁ + W₂ * X₂ + W₃ * X₃ >= 0 当 X1=1, X2=0 & X1 AND X2 = 0

-1 +W₁ >= 0 当 X1=1, X2=0 & X1 AND X2 = 0

W₁ >= 1，让我们选择W₁ = 2

对于X1=0, X2=1 & X1 AND X2 = 0 的组合，则Y = 1

h(x) = -1 + 2 * X₁ + W₂ * X₂ + W₃ * X₃ >= 0 当 X1=0, X2=1 & X1 AND X2 = 0

-1 +W₂ >= 0 当 X1=0, X2=1 & X1 AND X2 = 0

W₁ >= 1，让我们选择W₂ = 2

对于X1=1, X2=1 & X1 AND X2 = 1 的组合，则Y = 0

h(x) = -1 + 2 * X₁ + 2 * X₂ + W₃ * X₃ < 0 当 X1=1, X2=1 & X1 AND X2 = 1

-1 + 2 + 2 +W₃ < 0 当 X1=1, X2=1 & X1 AND X2 = 1

3 +W₃ < 0 当 X1=1, X2=1 & X1 AND X2 = 1

W₃ < -3 当 X1=1, X2=1 & X1 AND X2 = 1，让我们选择W₃ = -4

最终h(x) =-1 +2 * X1 + 2 * X2 - 4 * X3 (X3 = X1 AND X2)

最终的感知器网络应为

好了，让我们尝试重新构建上述布局的图形表示。每个感知器将由其函数表示。

我们不使用1个AND感知器，而是添加1个生成X1的感知器，以及另一个生成X2的感知器

现在，让我们添加虚拟感知器来接收输入，并将它们传递到下一层感知器

显然，上面的表示更好，它被称为MLP（多层感知器网络）。这正是ANN（人工神经网络）的常见布局。

输入由一组等于输入数量的感知器接收，这被称为输入层。

输出由感知器生成，每个输出一个感知器。这被称为输出层。

位于输入层和输出层之间的处理感知器称为隐藏层。

每个ANN只能有1个输入层和1个输出层，但可以有一个或多个隐藏层。隐藏层的数量取决于待优化问题的复杂度。

我们已经证明，通过添加1个感知器以及输出感知器，可以增加网络的额外能力。

有许多算法可用于ANN训练，ANN本身也有许多类型。我们将在未来的文章中讨论最常见的类型和算法。

然而，这一切都始于感知器的概念并在此基础上构建，因此，即使示例可能看起来不复杂，获得有关感知器的尽可能多的细节也很重要。

历史

2017年9月17日：初始版本

构建简单的AI .NET库 - 第4部分 - 超越感知器

系列介绍

文章介绍 - 第2部分“超越感知器”

更多感知器示例

使用感知器优化二元函数

NOT 函数

OR 函数

AND 函数

XOR 函数

AND 函数

OR 函数

历史