Activity Log Posts

  • rkuraya

#1 Python勉強会 データサイエンス入門

6月11日に実施したワークショップの内容をご紹介します。



【オンライン】#01 Python勉強会 データサイエンス入門@初学者歓迎


対象

Pythonに興味がある方

データの分析に興味がある方


概要

有名なタイタニック号の乗客の生存状況データを使用して、データ分析の手法まで解説をします。

GoogleColaboratory上で事前に用意されたサンプルコードを実行し、 実際にデータ前処理を実施し、データを可視化しながらハンズオン形式で特徴量を分析していきます。

  1. データの前処理 1-1. 欠損値の補間 1-2. 異常値と外れ値への対応

  2. 特徴量の分析 2-1. データの可視化 2-2. 特徴抽出


実施方法

Google Meet


タイムテーブル

19:00〜 開始

19:10〜 講師自己紹介

19:15〜 Python基礎&データの説明

19:40〜 実際にデータを分析する(ハンズオン)

21:00  終了



Pythonとは

・シンプルで覚えることが少ない構文

・1行で多くの処理を記述可能

・標準ライブラリとして、多くの機能があらかじめ用意されている

・更に幅広い用途に使えるPython向け外部ライブラリが豊富に存在している


Pythonは、AIや統計等の分野で広く使われているイメージが先行している影響もあり、

習得するのが難しいプログラミング言語だと思われがちですが、

実は非常に簡単な構造になっており、初学者にオススメできる言語になります。


AIなどの複雑なロジックを組む必要がある分野での採用率が高い背景としては、

言語自体はシンプルに記述できるといった点があります。

他の言語で実装すると、非常に長いコードを組まなければならない所を、

Pythonであれば、簡潔に実装できます。


Pythonがシンプルな構造で設計されている点については、言語の考案者である人物が

提唱している「プログラマが持つべき心構え(The Zen of Python)」の中でも

言及されています。



データサイエンスとは

データサイエンティストには、大きく3つの要素が求められます。

・ビジネス力 (Business Problem Solving)

・データサイエンス (Data Science)

・データエンジニアリング (Data Engineering)




上記の通り、技術的スキルを持っているだけでは、中々活躍は難しい現状があります。

分析対象のデータはどの業界なのか。その業界はどのような特性があり、どこに着眼すれば

良いのか。そういったビジネス的な感覚も併せ持った上で、技術的スキルと掛け合わせて

いくことで、事業の分析や予測が可能になります。


しかしながら、一人の人間が全てのスキルを習得するためのハードルは非常に高く、

ハイブリッド人材と呼ばれる、一般的に必要とされるレベルまで到達するには時間が掛かります。

一方で、データサイエンス分野は需要が年々高まってきており、人材の供給が追いついていないというのも事実としてあります。



近年では、「分析・統計」「ビジネス的観点」の2つに分担し、

分析・統計を担う人材を、「データエンジニア」、

ビジネス面を担う人材を、「アナリスト」それぞれ別の人格で、協力しながら

進めるケースも増えてきました。


データサイエンスの分野は確かにハードルが高いと感じる点が多々あるかもしれません。

しかし、このようにどちらか得意な方からでも、徐々に身につけていくといった「やり方」をする人が出始め、それが認められています。



データサイエンス分野に興味がある方、一度志したが、諦めてしまった方、

もう一度チャレンジしてみませんか。

閲覧数:24回0件のコメント

最新記事

すべて表示