CUDA事始め

会社でCUDAの使用事例を見かけたので知ったかぶるためにサンプルをちょこっと触ってみた。
動作の流れは"GPUメモリ確保"→"CPUからGPUへメモリ転送"→"GPUカーネル(関数)起動(ここが超並列動作)"→"GPUからCPUへメモリをフェッチ"てな具合みたい。
カーネルにブロックやスレッドのインデクスが渡されるのでそれを元に処理を分岐する(どのピクセル処理するか?etc)
さて、何となく使い方はわかったけどいったい俺の仕事のどこに使おう?