講師:Yuki
受講者数:689人
データサイエンスプロジェクトの80%を占めるデータ前処理と管理に焦点を当て、Apache SparkとPythonを使用した実践的なデータエンジニアリングスキルを習得できる、現場のニーズに即した実用的な入門講座です
Apache SparkとPySparkを使用したビッグデータの分散処理技術、データの前処理手法、効率的なデータ変換や加工のテクニック、そしてPandasやNumPyとの連携方法について実践的に学習します
現役のデータエンジニアによる実践的な指導、GitHubでのソースコード提供、実務で多用される分散処理フレームワークApache Sparkの基礎から応用までを体系的に学べる構成となっています
Pythonの基礎知識を持ち、データエンジニアリングやビッグデータ処理のスキルを習得したいエンジニア、特にデータサイエンスプロジェクトにおけるデータ前処理や管理に興味がある方に最適です
高度な機械学習アルゴリズムや統計的手法を学びたい方には不向きですが、まずはデータの前処理基盤を学んでから機械学習を学習することをお勧めします