职场小聪明第915章 什么叫线性可分和线性不可分
什么叫线性可分和线性不可分例如一个数据只要数据画出散点就是在坐标轴上画了很多点两类事物只要有不同通过数据分类那么他们的这些点一定有个边界那么就可以画出一条线把他们分开这就是线性可分。
但如果是一幅图例如一只猫你判断它是狗还是猫你需要找特征但它有各种姿势也就是数据不全本来就没办法数字化例如什么是耳朵什么是鼻子眼睛看都得劲别说数字化了猫还分很多种耳朵有大小有的还挡住了那没有看到耳朵是不是就不是猫这就很难讲了所以根本无法在一幅图里找出所有特征为就是无法完全数字化也就更难用比对的方法画出各种特征点其实现实世界都是这样我们人可能根据一个爪子就可以猜到是个猫或狗当然他肯定不是马的蹄子所谓人也是靠猜不可能拿到所有数据也就是说人也是靠概率。
那么人工智能也可以这么干。
就是百分之八十是猫百分之10是狗还有百分之是不知道是不是猴子所以就猜是猫。
我觉得就是反复推敲去除不必要的特征数据例如长了个肉球没了个眼睛。
在数据不全的情况下如果我们提取了大量的猫的图片掌握了大量的特征那么就可以猜了。
总比不知道好我觉得这就是非线性解决线性不可分问题哈哈。
好那我用一个童话故事把“线性可分”和“线性不可分”讲得更形象。
? 童话故事:森林里的分界线 很久很久以前在一片大森林里住着两群小动物: ? 一群是 小老鼠家族它们喜欢在森林的左边活动。
? 一群是 小松鼠家族它们喜欢在森林的右边活动。
每天老猎人都会从高高的山上往下看他发现: 啊原来只要在森林中间画一条直线左边全是老鼠右边全是松鼠! 这样一来哪怕老猎人只看到动物的一点点影子也能凭那条直线猜出是老鼠还是松鼠。
这就是 线性可分 ——用一条线就能把两类小动物分开。
? 可是森林越来越热闹了来了两种新的小动物: ? 小兔子:有的喜欢跟老鼠混在一起有的却爱跑到松鼠那边找坚果。
? 小狐狸:有时躲在老鼠堆里有时又跑去松鼠窝偷吃。
这下子老猎人可犯难了: “天啊!这下不行了我怎么画直线都画不出来呀!老鼠和松鼠之间掺杂了兔子和狐狸根本分不开嘛!” 这就是 线性不可分 ——无论怎么画直线都没法把不同动物分清楚。
? 魔法师的办法 森林里住着一位聪明的魔法师他说: 1. 增加维度 魔法师挥一挥手把森林从“平面”变成了“立体迷宫”。
原本纠缠在一起的老鼠、松鼠、兔子、狐狸突然在高维空间里站开了距离。
魔法师轻轻一划就能分开。
(这就是 核方法把数据映射到更高维度来解决问题) 2. 非线性边界 魔法师没有画直线而是用森林里的大树拼成一条弯弯曲曲的篱笆墙。
这样老鼠在篱笆这边松鼠在那边兔子和狐狸也能被慢慢分开。
(这就是 神经网络用很多“弯弯曲曲”的函数去逼近复杂边界) 3. 概率猜测 魔法师说: “有时候我也不能完全确定但我能说: 80% 是老鼠15% 是兔子5% 是狐狸。
” 虽然不是绝对正确但猜测已经足够聪明了。
(这就是 概率分类AI 像人一样“八九不离十”地判断) ? 故事寓意 ? 当森林里的动物分得很清楚就像老鼠和松鼠画一条直线就能解决这就是线性可分。
? 当森林里的动物混在一起就像兔子和狐狸搅局怎么画直线都不行这就是线性不可分。
? 魔法师的“魔法”就是现代人工智能的办法: ? 升维(核方法) ? 弯曲的边界(神经网络) ? 概率判断(贝叶斯思维) 所以AI 就像森林里的魔法师帮我们在人类看不清的混乱世界里画出新的“分界线”。
? 你这个思路很棒已经把“线性可分”和“线性不可分”的核心意思抓住了而且还自然地联系到了图像识别和人类认知的概率性。
让我帮你再系统梳理一下把概念、例子和人工智能的联系讲清楚。
? 一、什么叫 线性可分 ? 数学定义: 如果有两类数据点(比如正类和负类)能用一条直线(二维)、一个平面(三维)、或者更高维空间的一个超平面把两类数据完全分开那么就是线性可分。
换句话说:存在一个边界函数 w^Tx+b=0使得所有正类点在一边负类点在另一边。
本小章还未完请点击下一页继续阅读后面精彩内容!。
本文地址职场小聪明第915章 什么叫线性可分和线性不可分来源 http://www.dh1.net





