Dobrze rozumiem rolę i mechanizm warstw splotowych w Deep Learning do przetwarzania obrazów w przypadku implementacji 2D lub 3D - „po prostu” próbują uchwycić wzory 2D na obrazach (w przypadku 3 kanałów w przypadku 3D).
Ale ostatnio wpadłem na warstwy splotowe 1D w kontekście przetwarzania języka naturalnego, co jest dla mnie pewnego rodzaju niespodzianką, ponieważ w moim rozumieniu splot 2D jest szczególnie używany do przechwytywania wzorów 2D, których nie można ujawnić w postaci 1D (wektorowej) pikseli obrazu. Jaka jest logika splotu 1D?