當前位置：首頁 > 教育 > 正文

深度學習——深度學習模型的基本結構

啟示号
教育
2年前
393

1、全連接神經網絡(Fully Connected Structure)

最基本的神經網絡非全連接神經網絡莫屬了，在圖中，a是神經元的輸出，l代表層數，i代表第i個神經元。

兩層神經元之間兩兩連接，注意這裡的w代表每條線上的權重，如果是第l-1層連接到l層，w的上标是l，下表ij代表了第l-1層的第j個神經元連接到第l層的第i個神經元，這裡與我們的嘗試似乎不太一樣，不過并無大礙。

所以兩層之間的連接矩陣可以寫為如下的形式：

每一個神經元都有一個偏置項：

第l層的第i個神經元的輸出a是怎麼得到的呢？我們首先會對上一層的所有神經元與該神經元計算一個加權平均，最後不要忘記加上偏置項。這個值記為z，即該神經元的輸入。

如果寫成矩陣形式如下圖：

針對輸入z，我們經過一個激活函數得到輸出a：

常見的激活函數有：
這裡介紹三個：
sigmoid
Sigmoid 是常用的非線性的激活函數，它的數學形式如下：

它能夠把輸入的連續實值“壓縮”到0和1之間。
特别的，如果是非常大的負數，那麼輸出就是0；如果是非常大的正數，輸出就是1，如下圖所示：

sigmoid 函數曾經被使用的很多，不過近年來，用它的人越來越少了。主要是因為它的一些缺點：
**Sigmoids saturate and kill gradients. **（saturate 這個詞怎麼翻譯？飽和？）sigmoid 有一個非常緻命的缺點，當輸入非常大或者非常小的時候（saturation），這些神經元的梯度是接近于0的，從圖中可以看出梯度的趨勢。所以，你需要尤其注意參數的初始值來盡量避免saturation的情況。如果你的初始值很大的話，大部分神經元可能都會處在saturation的狀态而把gradient kill掉，這會導緻網絡變的很難學習。
Sigmoid 的 output 不是0均值. 這是不可取的，因為這會導緻後一層的神經元将得到上一層輸出的非0均值的信号作為輸入。
産生的一個結果就是：如果數據進入神經元的時候是正的(e.g. x>0 elementwise in f=wTx+b)，那麼 w 計算出的梯度也會始終都是正的。
當然了，如果你是按batch去訓練，那麼那個batch可能得到不同的信号，所以這個問題還是可以緩解一下的。因此，非0均值這個問題雖然會産生一些不好的影響，不過跟上面提到的 kill gradients 問題相比還是要好很多的。

tanh
tanh 跟sigmoid還是很像的，實際上，tanh 是sigmoid的變形：
tanh(x)=2sigmoid(2x)−1
與 sigmoid 不同的是，tanh 是0均值的。因此，實際應用中，tanh 會比 sigmoid 更好（畢竟去粗取精了嘛）。
tanh的函數圖像如下圖所示：

ReLu
近年來，ReLU 變的越來越受歡迎。它的數學表達式如下：
f(x)=max(0,x)
很顯然，從圖左可以看出，輸入信号<0時，輸出都是0，>0 的情況下，輸出等于輸入。w 是二維的情況下，使用ReLU之後的效果如下：

所以，整合一下上面說的：

2、循環神經網絡(Recurrent Structure)

循環神經網絡常用來處理Sequence類型的數據，比如一句話。
循環神經網絡的結構如下，簡單來說，我們的網絡結構定義在中間的f，它每次接受兩個輸入h和x，輸出y和h'：

當然，循環神經網絡也可以有多層，網絡結構如下圖所示：

另外，還有雙向循環神經網絡的結構：

了解了各種RNN的基本結構之後，那麼問題來了，f怎麼定義的呢，對于一般的RNN，中間的f定義如下（下面的定義忽略了偏置項）：

3、LSTM

在RNN的基礎上，還有一種常用的基本結構是LSTM，如果在RNN中，我們把輸入h看成是記憶的話，LSTM将這種記憶進一步分為了長時記憶和短時記憶：

這裡的c變化非常緩慢，可以認為是長時記憶，h變化非常快，可以認為是短時記憶。可以看到，LSTM的輸入有三項x，h，c，輸出也是三項，那麼對于三項輸入，LSTM内部是怎麼處理的呢？

根據x和h，我們會計算出三個門，分别為輸入門、遺忘門、輸出門。

根據這三個門，我們可以得到LSTM的基本結構如下：

上一時刻輸入的c與遺忘門進行對位相乘，選擇對之前信息的遺忘程度，然後加入這一時刻的輸入信息，作為這一時刻冊長時記憶c輸出。長時記憶經過tanh激活之後再與輸出門對位相乘，作為這一時刻的短時記憶輸出，h再經過一層神經網絡，得到這一時刻的輸出。看到這裡，想清楚過程，我們可以嘗試一下在紙上畫一下LSTM的結構。

還有一種常用的結構，這種結構使用程度漸漸超過了LSTM，稱為GRU，對LSTM網絡進行了壓縮，更容易訓練。下面圖上的公式實際是錯的，右邊第一項上标應該是t-1 .

4、卷積網絡

卷積網絡有兩個重要的特性
稀疏連接 Sparse Connectivity ：每個神經元僅與前一層部分神經元相連接
參數共享 Parameter Sharing：同一個feature map的參數是相同的。
假設有100 * 100像素的圖片，如果下一層有100個神經元，那麼全連接的神經網絡，将有100 * 100 * 100=100萬的參數，如果采用稀疏連接和參數共享，後一層的一個神經元隻與前一層的100個神經元連接，那麼需要100 * 100 = 1萬個參數，如果與不同神經元連接的這100條線的參數都相同，那麼隻需要100個參數，這叫一個feature map或者說一個field，但是這隻能學到一個特征，我們可以定義多個feature map來學習不同的特征，如果有100個feature map，那麼參數就是100 * 100的量。

如下面的圖中，我們定義了兩個feature map，紅橙黃連線上的參數是共享的，藍綠連線上的參數是共享的。

上面是卷積的概念，在卷積神經網絡中，還有一個重要的概念是池化：Pooling，即将幾個神經元的輸出變為一個輸出，池化的方法有平均法、最大值法和L2法。

視頻中還讨論的一個點是，我們該拿哪些結果進行池化，可以是同一個feature map出來的，也可以組合不同feature map出來的。

你可能想看：

楷書顔體的基本結構（二）平衡

楷書顔體的基本結構（二）平衡：結構的重心不能超越出該字的底部基礎之外，字的結構保持平衡。使結字和穆端正 2．有中豎的字，中豎應正直堅實，并處于該字的重心線上如果此中豎不是該字的最後一筆，則隻能用垂露如...

格律詩的結構特點和五絕的基本類型

字數、行數、平仄或輕重音、用韻都有一定限制。在我國古典格律詩中常見的形式有五言、七言的絕句和律詩（也就是我們經常說的五絕、五律、七絕、七律、排律等），詞、曲每調的字數、句式、押韻都有一定的規格。并且押...

以深度學習觀念提升課堂教學質量

從校外學科類培訓到校内的教學模式都發生了深刻變革。在内涵延展和課堂學習環節兩個方面構建起“科技人員在研究機器學習的機制時提出了多層次網絡學習的算法，時代政策的變化要求深度學習的内涵要随之适應，學生就一...

“安吉遊戲”專欄丨馮曉霞：“安吉遊戲”與深度學習——兼談我們為什麼要學安吉

積極主動、解決問題、實踐反思、創造思維、合作分享等這些深度學習的基本特點“我們就能真切地看到其中的深度學習以及在這種學習中幼兒表現出的新時代所需要的核心素養的萌芽，目前不少國家的教育體系中占據主導地位...

促進深度學習的四個維度

學習主體能夠批判性地學習新知識、新理論，其表現是依靠對文本信息進行記憶的提問、練習在教學中占據主要地位，所有思維活動都被引導向到答複、印證教師和教材所認定的标準答案，學習的本義是指通過閱讀、聽講、研究...

深度學習的特征及其意義

G.）一直從事機器學習模型、神經網絡與人工智能等問題的相關研究。并在機器學習模型特别是突破淺層學習模型，探讨了應用人工神經網絡刻畫數據的學習模型。首先提出了深度學習（deep learning）的概念...

閑話寫詩三：律詩平仄的基本格式與基本句型

一、律詩平仄的基本格式，律詩都要求符合平仄規律，五言律詩和七言律詩各有四種格式，基本格式隻有五律的四種平仄句型。可以構成五言律詩的四種平仄格式。野徑雲俱黑。仄仄平平仄，秋日亂清晖，⒊ 以句型C（仄仄腳...

互助問答第5期：Stata中系統GMM模型的穩健性檢驗和Stata命令等

Stata中系統GMM模型的穩健性檢驗和Stata命令答：一種是計量數據的穩健性檢驗。前者通常适用于所使用的計量方法比較新穎的研究，可用GMM進行穩健性檢驗（因為GMM不需要滿足經典計量假設）。生成...

結構設計均衡膠厚對于注塑成型的影響以及改善方案

均衡膠厚指的是注射成型時膠厚在模具系統内冷卻硬化時間要均衡，殼體的壁厚對部件的很多關鍵特性的影響至關重要，設計階段優化的殼體厚度可以降低後續可靠性測試的風險，但增加厚度會對手機的外觀。縮水現象是指由于...

第二章貨币制度學習題

國家對貨币的有關要素、貨币流通的組織與管理等加以規定所形成的制度：規定貨币材料、規定貨币單位、規定流通中貨币的種類、規定貨币法定支付償還能力、規定貨币鑄造發行的流通程序、規定貨币發行準備制度等：金屬貨...

127思維模型：合作模型一合作不是基于信任，而是持續的關系

所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。均衡狀況會是兩個囚徒都選擇背叛，在這種情況下沒有一個參與者可以通過獨自行動而增加收益，如果甲獨自改變策略進行合作，這種...

【解題研究】中考數學幾何必會模型：三垂直全等模型

許興華數學：1458篇原創内容，公衆号：今天老師給大家整理了中考數學需要掌握的幾何模型：助力中考；三垂直全等模型“中考數學幾何必會模型”三垂直全等模型，（4）投稿郵箱，或加主編微信xuxinghua1...

五種希格斯玻色子内部結構模型圖解析

五種希格斯玻色子内部結構模型圖解析:也是标準模型預言的最後一種粒子，物理學家普遍認為不排除未來可能會發現其他帶電荷的希格斯玻色子:而這些理論模型預言了應有五種不同希格斯玻色子，希格斯玻色子也許不是一個...

什麼是結構化思維？結構化思維的好處是什麼...

結構化思維是指在思考分析解決問題時。對問題進行正确的界定，能使建議更清晰、溝通更簡短、分析更有效、決策更高效、方案通過率更大，即當一個人在面對工作任務或者難題時能從多個側面進行思考，每個要點都需要按照...

三十種書法結構的寫法，半個小時讀完，書法結構就學好了

用筆法包括點畫寫法（古人有永字八法）：分享的常見的三十種書法結構的筆法？橫平豎直講的什麼意思，筆法二、上緊下松講的什麼意思，筆法三、上開下合講的什麼意思，我們發現凡是帶有口字的偏旁，筆法四、上收下放講...

産品結構設計·車載攝像頭的防水結構設計

車載攝像頭防水結構設計主要考慮以下四個部位的防水：車載攝像頭的防水主要是通過O型圈和矽膠防水圈，根據防水功能分為防水鏡頭和不防水鏡頭，需要在殼和鏡頭之間安裝O型圈來實現防水功能，隻要保證玻璃防水即可，...

沒骨花鳥畫的基本特點和技法

直接用顔色和墨色描繪物象，沒骨畫直接用色和墨來表現物象，強化了色與墨的表現力，使色彩筆墨化，沒骨畫筆法和墨法，借助山水畫的皴擦等畫法，也可以用色來破墨：就是先用墨色畫出物象來。這是山水畫中常用的一種畫...

行書的基本筆法及用筆特點

行書的基本筆法及用筆特點，運筆上要注意上下俯仰的萦帶關系，亦有要引帶下一筆而不出鋒的回鋒撇和向上端帶出的挑鈎帶上撇，捺是行書中最重要的筆畫，行書的挑法除近似楷書的寫法一種外，不能露出方折刻闆的鋒棱，折...

羽毛球業餘愛好者提高球技的基本原則

一、力争在身體前上方擊球，每次擊球後應立即回到中心位置。在雙打防守時則應回到與同伴平行的位置，而在雙打進攻時則應與同伴保持前後的位置，在雙打發球時，發一短球後應立即向前封網以防對手打短球回擊。雙...

哲學的基本問題

(1)思維和存在何者是本原的問題。(2)思維和存在有沒有同一性的問題，為什麼思維和存在的關系問題是哲學的基本問題，(1)思維和存在的關系問題貫穿哲學發展的始終。是圍繞物質和意識誰是本原的問題展開的。(...

第二章戰争的基本原則是保存自己消滅敵人

在具體地說到遊擊戰争的戰略問題之先，還要說一說戰争的基本問題。一切軍事行動的指導原則，都根據于一個基本的原則，消滅敵人的力量。在革命戰争中是直接地和基本的政治原則聯系着的。例如中國抗日戰争的基本政治原...

python的基本語法和腳本格式

我們在上一篇文章中已經學會了如何簡單的運行python命令和腳本，當Python解釋器讀取源代碼時，第二行注釋是為了告訴Python解釋器:Python在語義中存在着包、模塊、類（當然還有函數）這幾個...

編寫家譜的基本知識，建議收藏

是以記載父系家族世系、人物為中心的曆史圖籍，記載一個以血緣關系為主體的家族世系繁衍和重要人物事迹的特殊圖書體裁。家譜以記載父系家族世系、人物為中心，記載的是同宗共祖血緣集團世系人物和事迹等方面情況的曆...

編制招标文件的基本原則

招标文件是招标（采購）人意願的體現；招标文件是采購項目驗收的重要參照。對招标采購活動起着如此重要作用的招标文件，準确完整的招标需求說明，能夠使投标人（供應商）在編制投标文件時有的放矢。（二）招标人在招...

考前輔導丨滿分作文的基本标準，掌握3個寫作規範，你也能夠輕松寫出好作文……

出現寫跑題了、審題不準、沒有寫完等現象。考場作文其實更好寫，我們隻需要掌握好基本的寫作規範就行了，根本沒有時間寫完作文。我想這是同學們和家長朋友們并沒有理解滿分作文的基本标準，作文的核心要求就是一個真...

校園保安服務的基本任務

紛紛把維護校園安全、穩定的重擔交給了保安服務公司。保安服務公司和校園專職保安員在為校園提供保安服務的過程中必須要明确工作任務，切實做好校園安保工作。一、配合有關部門積極維護校園的政治穩定 ...

髒腑别通的基本運用

有關子宮的疾患也與膀胱經有關 ( 詳見董氏奇穴治療學第一章附論 )，也可以說是透過髒腑别通的肺與膀胱通起到作用的。針灸治濕熱黃疸在古書中最常用腕骨穴〈見通穴指要賦、玉龍歌、玉龍賦〉，以脾經之陰陵泉治療...

神經網絡 sigmoid

上一篇
“卡還在，店沒了”——拿什麼拯救你？我的預付卡

下一篇
表證與瘀血的關系

深度學習——深度學習模型的基本結構

1、全連接神經網絡(Fully Connected Structure)

2、循環神經網絡(Recurrent Structure)

3、LSTM

4、卷積網絡

有話要說...取消回複

最新文章

看墳地風水順口溜與墓地風水口訣100條

教你把脈知男女

鄧中甲方劑學講稿—第四章清熱劑—清營涼血—犀角地黃湯

北京頤和園：養雲軒探秘

觀點引流大揭秘：如何用鮮明觀點，吸引高客單價用戶

李辛最新采訪 | 孩子身心問題背後的原因（下）

針家心悟：針灸如何取穴（純幹貨）

有哪些非常實用的職場道理，是當了領導以後才明白的

熱門文章

威士忌高階關于 OB 與 IB，一次給你說透！

為什麼五點鐘要起床答案讓人吃驚！（現在知道還不晚）

美麗中國-2870：中國最大的内陸河，塔裡木河

老張老李侃門球之140篇

這個穴位可以治療多種胃痛腹痛，還可以減肥

診餘雜記（師傳經驗）

二十四山開門放水作竈真訣開門放水作竈直訣——子山

門球技巧隻需五個字讓你打好門球