本/雑誌
爆速Python 巨大データセットを扱うための高速化テクニック / 原タイトル:Fast Python (Programmer’s)
TiagoRodriguesAntao/著 クイープ/監訳
3960円
ポイント | 1% (39p) |
---|---|
発売日 | 2024年06月下旬発売 |
出荷目安 | メーカー在庫あり:1-3日
※出荷目安について |
- 追跡可能メール便 送料無料
著者・出版社・関連アーティスト
商品説明
本書の目的は、Pythonエコシステムでより効率的なアプリケーションを記述する手助けをすることにあります。より効率的とは、コードが使うCPUサイクル、ストレージ領域、ネットワーク通信が少なくなることを意味します。本書では、パフォーマンスの問題に総合的なアプローチでのぞみます。ピュアPythonでのコード最適化テクニックについて説明するだけではなく、NumPyやpandasなど広く使われているデータライブラリの効率的な使い方についても検討します。Pythonでは十分なパフォーマンスが得られないケースがあるため、スピードがさらに求められる場合はCythonについても検討します。この総合的なアプローチの一環として、コードの設計にハードウェアが与える影響にも目を向け、現代のコンピュータアーキテクチャがアルゴリズムのパフォーマンスにおよぼす影響を分析します。また、ネットワークアーキテクチャが効率におよぼす影響と、高速なデータ分析でのGPUコンピューティングの使い方も調べます。
関連記事
収録内容
1 | 1 基礎的なアプローチ(データ処理の効率化が急がれている |
2 | 組み込み機能のパフォーマンスを最大限に引き出す |
3 | 並行性、並列性、非同期処理 |
4 | ハイパフォーマンスなNumPy) |
5 | 2 ハードウェア(Cythonを使って重要なコードを再実装する |
6 | メモリ階層、ストレージ、ネットワーク) |
7 | 3 現代のデータ処理のためのアプリケーションとライブラリ(ハイパフォーマンスなpandasとApache Arrow |
8 | ビッグデータの格納) |
9 | 4 高度なトピック(GPUコンピューティングを使ったデータ分析 |
10 | Daskを使ったビッグデータの分析) |
11 | 付録A 環境のセットアップ |
12 | 付録B Numbaを使って効率的な低レベルコードを生成する |