募集終了2022年02月02日掲載開始
【機械学習エンジニア】学習サービス事業
この案件は募集が終了しています。
案件をリクエストすることで、優先的に似た案件の紹介を受けることが可能です。案件について
データベース(DB)エンジニア
データサイエンティスト
上記の職種経験がなくてもスキルが一致すれば応募可能
週2日
週3日
週4日
週5日
700,000円
~/
月単価
東京都
千代田区
受託サービス
業務内容
■業務内容
多様な教育サービスのデータを用いた機械学習モデル開発を担う機械学習エンジニアのポジションです。
▼業務概要
● パーソナライズ学習実現に向けた機械学習モデルの開発。
● 部門内のサービス改善を目的とした機械学習モデルの開発。
▼業務詳細 (モデル構築フェーズ)
● ビジネス要求ヒアリング
● 要求を踏まえて機械学習タスクの全体設計
● タスク開始前の基礎分析
● モデル構築方針の検討 (特徴量選定、手法検討、評価方法検討)
● モデルの実装 (ライブラリ利用。最新論文手法の実装)
● モデルの定量・定性評価
● モデル開発結果のレポーティング
▼業務詳細 (モデルのシステム導入フェーズ)
● 効果検証のグランドデザインの設計
● 効果検証のために追加取得すべきデータ要件の設計
多様な教育サービスのデータを用いた機械学習モデル開発を担う機械学習エンジニアのポジションです。
▼業務概要
● パーソナライズ学習実現に向けた機械学習モデルの開発。
● 部門内のサービス改善を目的とした機械学習モデルの開発。
▼業務詳細 (モデル構築フェーズ)
● ビジネス要求ヒアリング
● 要求を踏まえて機械学習タスクの全体設計
● タスク開始前の基礎分析
● モデル構築方針の検討 (特徴量選定、手法検討、評価方法検討)
● モデルの実装 (ライブラリ利用。最新論文手法の実装)
● モデルの定量・定性評価
● モデル開発結果のレポーティング
▼業務詳細 (モデルのシステム導入フェーズ)
● 効果検証のグランドデザインの設計
● 効果検証のために追加取得すべきデータ要件の設計
募集背景・課題
■募集背景・課題
現在、弊社内で保持する学習データやアセスメントデータの活用にも本腰を入れ始めています。
機械学習によるデータ活用の方向性としては、教育業界におけるインパクト創出と既存サービスの成長支援の2パターンで考えています。
例えば下記のようなテーマを想定しています。
・教育業界におけるインパクト創出: 個別学習実現のための機械学習モデル開発
・既存サービスの成長支援: 弊社サービスにおけるレコメンドモデル開発
またR&D的な取り組みとして、集合研修などリアルな場におけるデータ解析なども検討しています。
これらの実現のために、データ専門性の高い人材を集めたデータサイエンスチームを組成し、体制強化を進めています。
なお、チーム内での役割分担は下記のようにしています。
・データサイエンティスト: データによる新しい価値創造をゴールとするデータ分析やモデル開発を担う。
・機械学習エンジニア: サービス実装をゴールとした機械学習のモデル開発を担う。
・データエンジニア: データ活用の要となるデータ基盤開発と運用を担う。
現在、弊社内で保持する学習データやアセスメントデータの活用にも本腰を入れ始めています。
機械学習によるデータ活用の方向性としては、教育業界におけるインパクト創出と既存サービスの成長支援の2パターンで考えています。
例えば下記のようなテーマを想定しています。
・教育業界におけるインパクト創出: 個別学習実現のための機械学習モデル開発
・既存サービスの成長支援: 弊社サービスにおけるレコメンドモデル開発
またR&D的な取り組みとして、集合研修などリアルな場におけるデータ解析なども検討しています。
これらの実現のために、データ専門性の高い人材を集めたデータサイエンスチームを組成し、体制強化を進めています。
なお、チーム内での役割分担は下記のようにしています。
・データサイエンティスト: データによる新しい価値創造をゴールとするデータ分析やモデル開発を担う。
・機械学習エンジニア: サービス実装をゴールとした機械学習のモデル開発を担う。
・データエンジニア: データ活用の要となるデータ基盤開発と運用を担う。
経験・スキルについて
必須となるスキル・ご経験
下記に列挙するデータ専門性とエンジニアリング力を全て保持していること。
[データ専門性]
・SQL: SQLの構文を一通り理解し、記述、実行できる (DML、DOLの理解。、種JOINの使い分け、集計関数とGROUP BY、ASE文、副問合せなど) 。加えて数百行のSQLを解読する事が出来る。
・統計: 統計検定2級レベルの内容を用いた実務経験を持つ。
・機械学習: 教師あり学習モデル、教師なし学習モデルの実務における構築経験を持つ(「はじめてのパターン認識」に相当する内容をイメージ) 。また、特徴量エンジニアリング、モデルの性能チューニング、モデルのオフライン性能評価のノウハウを持つ。
[エンジニアリング力]
・システム設計能力: 機械学習モデルをシステム導入する際のシステムアーキテクチャの検討が出来る。また、システム稼働中に発生する運用課題を洗い出す事が出来る。
・アプリケーション開発: Flask や FastAPI などを利用して、機械学習モデルを本番利用するためのアプリケーションを開発することが出来る。サービス開発担当のアプリケーション開発エンジニアとシステム導入にあたっての技術面の相談が出来る。
・コンピューターサイエンス: IPA 基本情報技術者試験レベルのコンピューターサイエンスの知識を保有し、実務で利用する事が出来る。
【効果検証のためのデータ分析開発環境は下記になります。】
● インフラ
○ GCP (データ基盤) / AWS (関連システム)
● データパイプライン (ETL)
○ CloudComposer (Airflow)
● DWH
○ BigQuery
● その他インフラ管理
○ Docker
○ GKE / GAE / CloudRun
● 可視化ツール
○ Google Data Portal / Tableau
● 分析環境
○ Jupyter Notebook / Google Colab / Google Cloud ML
● 監視
○ Cloud Logging / Stackdriver Logging
● その他
○ Git / GitHub / Slack / Notion
[データ専門性]
・SQL: SQLの構文を一通り理解し、記述、実行できる (DML、DOLの理解。、種JOINの使い分け、集計関数とGROUP BY、ASE文、副問合せなど) 。加えて数百行のSQLを解読する事が出来る。
・統計: 統計検定2級レベルの内容を用いた実務経験を持つ。
・機械学習: 教師あり学習モデル、教師なし学習モデルの実務における構築経験を持つ(「はじめてのパターン認識」に相当する内容をイメージ) 。また、特徴量エンジニアリング、モデルの性能チューニング、モデルのオフライン性能評価のノウハウを持つ。
[エンジニアリング力]
・システム設計能力: 機械学習モデルをシステム導入する際のシステムアーキテクチャの検討が出来る。また、システム稼働中に発生する運用課題を洗い出す事が出来る。
・アプリケーション開発: Flask や FastAPI などを利用して、機械学習モデルを本番利用するためのアプリケーションを開発することが出来る。サービス開発担当のアプリケーション開発エンジニアとシステム導入にあたっての技術面の相談が出来る。
・コンピューターサイエンス: IPA 基本情報技術者試験レベルのコンピューターサイエンスの知識を保有し、実務で利用する事が出来る。
【効果検証のためのデータ分析開発環境は下記になります。】
● インフラ
○ GCP (データ基盤) / AWS (関連システム)
● データパイプライン (ETL)
○ CloudComposer (Airflow)
● DWH
○ BigQuery
● その他インフラ管理
○ Docker
○ GKE / GAE / CloudRun
● 可視化ツール
○ Google Data Portal / Tableau
● 分析環境
○ Jupyter Notebook / Google Colab / Google Cloud ML
● 監視
○ Cloud Logging / Stackdriver Logging
● その他
○ Git / GitHub / Slack / Notion
歓迎されるスキル・ご経験
下記に列挙する項目のいずれかを満たしている事。
[データ専門性]
・機械学習: パターン認識と機械学習 (PRML) の上下巻と統計的学習の基礎 (ESL) に相当する機械学習の知識。
・自然言語処理: 形態素解析、構文分析、固有表現抽出のアルゴリズムを理解し、使いこなせる。トピックモデル、サポートベクターマシンなどの文書分類手法を理解し、実行出来る。
RNNやLSTMなどを用いたニューラルネット型言語モデルを理解し使いこなせる。
・Deep Learning: 各種トップカンファレンスやarXivの論文を含めたDeep Learning系統の最先端の研究開発動向に精通している。
[エンジニアリング力]
・API開発: 機械学習モデルの推論結果を提供するAPIのシステム設計が出来る。(インフラ設計、API仕様策定)。機械学習モデルの推論結果を提供するAPIのシステム運用方針を決められる。
・データ設計能力: ビジネスプロセスを理解して、データフロー図、論理データモデル、ER図、テーブル定義書を作成することが出来る。モデル開発やオンライン性能検証の際に必要となるログ要件を作成することが出来る。
・計算量への理解: 計算量オーダーの概念を理解し、自身が開発した機械学習モデルの実行時間を見積もる事が出来る。見積もった実行時間や将来の予測対象数の拡大も考慮して、適切な手法選定に活かすことが出来る。
・バッチ処理実装: 機械学習モデルの学習や推論処理実行のためのバッチ処理実装が出来る。後続のサービス開発側のジョブ実行を考慮したジョブ設計が出来る。ジョブのエラーハンドリングを行うための設計が出来る。
[ビジネス力]
・コミュニケーション力: 相手の理解度に合わせて説明粒度を調整して説明する能力。
[データ専門性]
・機械学習: パターン認識と機械学習 (PRML) の上下巻と統計的学習の基礎 (ESL) に相当する機械学習の知識。
・自然言語処理: 形態素解析、構文分析、固有表現抽出のアルゴリズムを理解し、使いこなせる。トピックモデル、サポートベクターマシンなどの文書分類手法を理解し、実行出来る。
RNNやLSTMなどを用いたニューラルネット型言語モデルを理解し使いこなせる。
・Deep Learning: 各種トップカンファレンスやarXivの論文を含めたDeep Learning系統の最先端の研究開発動向に精通している。
[エンジニアリング力]
・API開発: 機械学習モデルの推論結果を提供するAPIのシステム設計が出来る。(インフラ設計、API仕様策定)。機械学習モデルの推論結果を提供するAPIのシステム運用方針を決められる。
・データ設計能力: ビジネスプロセスを理解して、データフロー図、論理データモデル、ER図、テーブル定義書を作成することが出来る。モデル開発やオンライン性能検証の際に必要となるログ要件を作成することが出来る。
・計算量への理解: 計算量オーダーの概念を理解し、自身が開発した機械学習モデルの実行時間を見積もる事が出来る。見積もった実行時間や将来の予測対象数の拡大も考慮して、適切な手法選定に活かすことが出来る。
・バッチ処理実装: 機械学習モデルの学習や推論処理実行のためのバッチ処理実装が出来る。後続のサービス開発側のジョブ実行を考慮したジョブ設計が出来る。ジョブのエラーハンドリングを行うための設計が出来る。
[ビジネス力]
・コミュニケーション力: 相手の理解度に合わせて説明粒度を調整して説明する能力。
開発環境
開発言語
フレームワーク
データベース・クラウド・仮想化
サーバー・OS・ネットワーク
サーバーOS/ネットワーク
案件ID:2011
この案件は募集が終了しています。
案件をリクエストすることで、優先的に似た案件の紹介を受けることが可能です。