EllisShang

ケーススタディ

Waterloo Experience Accelerate – Microsoft AI インターン

Python フルスタック開発インターン · Microsoft AI · University of Waterloo · 2021年5月 - 2021年8月

概要

University of Waterloo と Microsoft Canada による WEA プログラムで、Azure 上に構築した Python ベースの Web AI システムを開発し、数万件の求人票に含まれるバイアス検出を行うプロジェクトのテックリードを務めました。

主要技術

PythonFastAPIAzure App ServiceAzure Machine LearningAzure StorageAzure FunctionsPandasscikit-learn

成果

  • Microsoft AI / Waterloo Experience Accelerate プロジェクトで 60,000 件の求人票を分析処理。
  • 求人票に含まれる社会的バイアス、アイデンティティ表現、職場多様性の課題を検出する感情・言語バイアス分析ワークフローを構築。

ストーリーとプロセス

概要

Waterloo Experience Accelerate (WEA) – Microsoft AI は、University of WaterlooMicrosoft Canada が共同で実施するインターンシッププログラムです。

参加者は職場スキル研修と Azure ベースの AI / ML トレーニング を受け、その後 Microsoft が提示する実課題に対してチームでソリューションを構築します。

私はその中で Python フルスタック開発インターン として参加し、データ収集・バックエンドアーキテクチャ・Azure 上での機械学習処理を担当しました。

プロジェクト:求人票のバイアス検出 AI システム

チームでは、数万件の求人票から潜在的なバイアスを検出する Web AI システム を開発しました。

  • Python 製バックエンド API を設計・実装し、求人データの取得・前処理・提供を担当。
  • 大量の求人情報を取得するための スクレイピングおよびデータ収集パイプライン を構築。
  • Azure Machine Learning を用いて、求人票中のバイアスを検出するカスタムモデルをトレーニング。
  • ソリューション全体を Azure クラウド 上にデプロイし、数万件規模のデータを扱えるようスケーラビリティを確保しました。

役割とチームワーク

  • 4人チームのテックリード として、技術選定やアーキテクチャ設計をリード。
  • ソフトウェア開発経験の少ないメンバーに対し、AzureAI/ML ツールチェーン の使い方をレクチャー。
  • コードレビューや設計レビューを通じて、データ収集から推論までのパイプラインの品質と保守性を高めました。

技術的ハイライト

  • Python フルスタック開発:バックエンド実装と Web フロントエンド統合を担当。
  • データアーキテクチャと収集:大規模な求人データ収集とクリーニングのワークフローを設計。
  • カスタム AI モデル:テキスト前処理・特徴抽出・モデル学習パイプラインを構築し、偏見表現の検出を実現。
  • Azure との統合:Azure のコンピュート・ストレージ・ML サービスを活用し、実験から本番デプロイまでを一貫して管理しました。

成果

  • 数万件の求人票をスキャンし、潜在的なバイアスを検出できる AI システム を完成させ、プロジェクトの目標を達成。
  • 技術力だけでなく、リーダーシップやメンタリング面も評価され、雇用主から高い評価 を得ました。