自動(dòng)編碼器是無(wú)監(jiān)視的神經(jīng)網(wǎng)絡(luò)模型，可以學(xué)習(xí)輸入數(shù)據(jù)的隱含特征。這稱為編碼(coding )，可以利用同時(shí)學(xué)習(xí)到的新特征重構(gòu)原始輸入數(shù)據(jù)。這被稱為解碼(decoding )。從直觀上看，自動(dòng)編碼器可以用于特征降維，類似于主成分分析PCA，但性能比PCA高，是因?yàn)樯窠?jīng)網(wǎng)絡(luò)模型可以提取更有效的新特征。

編碼器：該部分可以將輸入壓縮為潛在的空間表示，可以用編碼函數(shù)h=f(x )表示。

解碼器：這個(gè)部分可以重構(gòu)來(lái)自潛在空間表示的輸入，可以用解碼器函數(shù)r=g(h )表示。

自編碼器結(jié)構(gòu)

因此，整個(gè)自編碼器可以用函數(shù)g(f ) x ) )=r進(jìn)行記述。其中，輸出r接近原始輸入x。

目前，自編碼器的應(yīng)用主要有兩個(gè)方面，一是數(shù)據(jù)去噪，二是為可視化而降維。通過(guò)設(shè)置適當(dāng)?shù)木S和稀疏約束，自編碼器可以學(xué)習(xí)比PCA等技術(shù)更有趣的數(shù)據(jù)投影。

編碼器可以根據(jù)數(shù)據(jù)樣本進(jìn)行無(wú)監(jiān)視的學(xué)習(xí)。也就是說(shuō)，可以將該算法應(yīng)用于數(shù)據(jù)集，獲得良好的性能。另外，不需要新的特征工程，只需要適當(dāng)訓(xùn)練數(shù)據(jù)。

但是，自編碼器在圖像壓縮方面做得不好。由于在特定的數(shù)據(jù)集上訓(xùn)練自編碼器，因此處理與訓(xùn)練集相似的數(shù)據(jù)時(shí)會(huì)得到良好的壓縮結(jié)果，但壓縮其他差異較大的圖像時(shí)沒(méi)有效果。這里，像JPEG這樣的壓縮技術(shù)在通用的圖像壓縮方面更優(yōu)越。

自動(dòng)編碼器是神經(jīng)網(wǎng)絡(luò)的一種，經(jīng)過(guò)訓(xùn)練后可以嘗試將輸入復(fù)制到輸出上。換言之，就是使輸出的內(nèi)容和輸入的內(nèi)容相同。自動(dòng)編碼器的內(nèi)部有隱式層h，可以生成編碼來(lái)表示輸入。可認(rèn)為該網(wǎng)絡(luò)由一個(gè)編碼器h=f(x )和生成重構(gòu)的解碼器r=g ) h )兩部分組成。最后使x等于約g(f ) x ) )。網(wǎng)絡(luò)不能設(shè)計(jì)為x=g(f ) x ) )。理論上可以，但通常不做。

自動(dòng)編碼器應(yīng)該被設(shè)計(jì)成不能學(xué)習(xí)完美的拷貝，通過(guò)施加一些限制，自動(dòng)編碼器只能進(jìn)行近似的拷貝。由于它們可以學(xué)習(xí)數(shù)據(jù)的有用特性，因此自編碼器根據(jù)約束而具有不同的屬性。