# CMU DB 13. Query Execution II - Neunomizuの日記

授業

久々!

めっちゃ久々に授業を受ける.まぁ色々あったのですが,3月中に終わらせられるように爆速で視聴していきたいです()

query executionについて先週は暑かった.

今回は複数スレッドでのquery executionについてやるっぽい.並列処理についてやるっぽい.

parallel execution
- パフォーマンスがよくなる
- 所有権の総コストが減る
parallet vs distributed
- データベースはDBMSの異なる面を改善するために複数の資源に渡って広がっている
- 一つのDBMSでも並列･分散DBMSでも同じ結果がでないと行けない
parallel DBMS
- 物理的にそれぞれの機械が近い
- 高速でそれぞれが繋がっている
- 通信は安く,信頼できる
distributed DBMS
- 物理的に遠い
- 比較的遅い通信でつながっている
- 通信の費用と問題は無視できる

DBMSのprocess modelは平行の要求をどう支持するかを定義している.

clientに変わってタスクを処理する単位をworkerという

multi-threadedだといくつかの利点があるcontext switchあたりのoverheadが少なく共有メモリを管理する必要がない.

scheduling

DBMSはクエリについ,どこでいつどうやってそれを実効するかを決める.

OSはいつもよりも多くのことを知っている必要がある.(task, CPU, 出力をどこで保管するかなど)

intra-query parallelism

ディスクがいつも主なボトルネックな場合,並行処理は助けにはならない

複数のストレージ装置に渡ってDBMSを分ける.

これはDBMSにとって明らか.

partitioning
- 単一の論理テーブルをバラバラな物理的なsegmentに分ける
- 理想的にはpartitioningはアプリケーションには明らか
vertical partitioning
- 個別の場所にテーブルのattributeを保管する.
- もともとのrecordを再構築できるための情報を保管する必要がある.
horizontal partitioning
- テーブルのtuplesをバラバラのsegmentにする.partitioning keyに応じて

並行処理は大事

(ほぼ)すべてのDBMSはこれに対応している.

正しく処理するのは難しい.

中間試験前だからか軽かったです.

並行処理は大事ですよね(適当).