| 講演抄録/キーワード |
| 講演名 |
2025-06-06 13:00
Tensor Coreによる二次元畳み込みの高速化 ○吉田 樹(名工大)・前田慶博(芝浦工大)・福嶋慶繁(名工大) |
| 抄録 |
(和) |
2次元畳み込みは画像処理や機械学習における基盤技術であり,特に高速な処理が求められる場面では,その効率化が重要となる.
本研究では,NVIDIA GPUに搭載されているTensor Coreを活用し,従来は多チャンネル向けに最適化されていた行列積演算ユニットを,単一チャネルの2次元畳み込みに適用する手法を提案する.
Diagonal Kernel Image Loop Unrolling(DKILU)を基盤としつつ,Tensor Coreの特性を最大限活かすためのデータ整形,ループ展開,メモリ最適化,アトミック加算削減など,複数の最適化を施した実装を構築した.
実験では,各種GPU上における既存ライブラリであるNPP,cuDNN,cuFFT,OpenCVや著者実装のCUDA Coreベース手法との比較を通じて,本手法が広範なカーネルサイズにおいて高速な性能を発揮することを示した.
また,行列積ベンチマークやメモリ帯域測定とも連携し,提案手法が実応用におけるGPU性能指標として有効であることを示す. |
| (英) |
|
| キーワード |
(和) |
GPU / Tensor Core / 高速化 / 畳み込み / / / / |
| (英) |
/ / / / / / / |
| 文献情報 |
映情学技報 |
| 資料番号 |
|
| 発行日 |
|
| ISSN |
Online edition: ISSN 2424-1970 |
| PDFダウンロード |
|