GPU-based SQL 資料庫 - 顯卡

Table of Contents

想請教有沒有人有使用GPU加速SQL速度的經驗

雖然我還沒實作,但以下是我的猜測
(Centos 7, C++, CUDA in C++, MariaDB, CPU八核心)

﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍

程式的執行是由int main開始

接著併發一千個cuda thread, parse 「mysqlcppconn」 lib給每個thread

(mysqlcppconn 是一個mysql寫給C++ lib, mariadb也可用)

每個thread單獨連接mariadb,mariadb不設thread pool,也就是one thread per connection

cuda thread 執行完query, 返回結果給int main

﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍﹍


根據我的猜測,以下這幾點是不是正確的呢?

1. mariadb的query 執行一樣是CPU,不管是直接c++呼叫,還是從一千個cuda thread

2. 根據1, 只是一千個query在CPU一直task switch

另外,上網查GPU-based的SQL, 好像SQLite目前有支援GPU執行

https://www.cs.virginia.edu/~skadron/Papers/bakkum_sqlite_gpgpu10.pdf

http://wscg.zcu.cz/wscg2014/Short%5CK17-full.pdf

我還沒時間仔細看,但直接看結論,似乎SQLite可以真正作到

把「SQLite」包在每個cuda thread,真的是同時執行一千個sql query

而不是還要透過CPU一層

希望可以聽到有經驗的人的分享,謝謝

--

All Comments

Emily avatarEmily2016-08-06
DB可以用udf把資料丟到cuda排序
Regina avatarRegina2016-08-09
等你測試@@因為我覺得用in memory DB解決I/O bound或簡化
Bennie avatarBennie2016-08-13
改用NOSQL。資料庫bound不太容易在CPU吧
Hazel avatarHazel2016-08-16
小弟拙見 參考看看 就我所知,cuda thread計算能力不比
CPU 純粹是靠數量多撐起來的效能,那差別可能像國小跟大
Irma avatarIrma2016-08-21
學生的程度,因為我並不清楚sql query真正在處理什麼
Dinah avatarDinah2016-08-24
但是可以預見的應該是很多條件判斷式,這對cuda thread
來說是很難的事,速度會很慢 我猜應該是這個原因所以做
Kyle avatarKyle2016-08-28
的人很少,基本上gpgpu做的運算都是非常簡單的運算才會
快得起來的
Anonymous avatarAnonymous2016-08-28
我會認為如果同時有大量sql squery的需求才做這種研究
要想透過GPU加速,你可能要先試試看單個cuda thread的
Oscar avatarOscar2016-09-01
我印象中GPGPU能執行的任務有滿大的限制
Odelette avatarOdelette2016-09-04
response time有多久,可以接受再繼續做會好一點
Isabella avatarIsabella2016-09-06
GPGPU另外一個瓶頸在PCI-E的頻寬,除非資料量夠大也夠平
Oscar avatarOscar2016-09-06
行化,不然最簡單算上資料從記憶體複製到GPU,在用cuda
thread處理,這時間應該會是一個考量的點
Olive avatarOlive2016-09-10
一點拙見 參考看看 如果有錯誤的地方還請指正
Eden avatarEden2016-09-11
我跟樓上想法差不多,補充一下,運算都簡單的話代表資料庫
Lydia avatarLydia2016-09-12
不複雜,那瓶頸改用NOSQL就能改善很多;複雜的話,GPGPU並
不會比CPU更適合。所以我很好奇到底哪種情境會適合SQL。
Jacob avatarJacob2016-09-16
全文檢索?我覺得建metadata可能幫助比較大
Kyle avatarKyle2016-09-18
但是你想想,上千萬筆同時被query又沒索引,bound一定是在
Adele avatarAdele2016-09-23
Disk而不會是運算單元阿。
Rebecca avatarRebecca2016-09-25
我是覺得可以參考SAP HANA full text search
Hamiltion avatarHamiltion2016-09-26
提一點想法 你提到很簡單的query,但就是資料量很多
Ursula avatarUrsula2016-09-30
多是多少?比GPU的記憶體還多嗎?如果是的話,會卡PCI-E
一般GPU最多好像就12GB 應該很容易超過?
Olivia avatarOlivia2016-10-04
那假設沒超過好了,我依舊認為雖然你認為簡單的操作,
對CUDA thread來說應該是很難的事
Hedy avatarHedy2016-10-05
那如果以上都不考慮,先從簡單的等分資料就可以開始做吧