資訊課程

Python影像辨識與智慧製造

課程時數 54hrs
先備能力
適學對象
  • 有興趣朝影像辨識與智慧製造領域發展者
  • 需協助產業協助自動化作業建置者
學習目標
  • 深入淺出引導學員掌握 Python 影像處理,從 OpenCV 基礎演進至 YOLO 物件偵測、MediaPipe 姿態辨識與 OCR 文字轉譯
  • 結合 Streamlit 網頁開發,將 AI 技術轉化為智慧製造監控、運動教練與文件自動化等實戰應用
課程內容
  • 圖像初始化與基礎處理(OpenCV)
  • 影像操作技術與偵測入門
  • 傳統機器學習
  • CNN卷積神經網路:TensorFlow / PyTorch
  • 遷移學習 Transfer Learning
  • YOLO 基礎與進階
  • 物件追蹤:ByteTrack
  • 影像分割基礎與進階應用
  • Mediapipe偵測:人臉、手勢、骨架與肢體偵測
  • 人體姿勢顯示(2D→3D)與情緒偵測
  • AI運動教練
  • EasyOCR / Tesseract:文字辨識處理
  • 綜合專題與模型部署
習得技能
  • 掌握OpenCV影像處理技術、TensorFlow與PyTorch模型訓練框架技術
  • 互動介面開發:學習使用 Streamlit 框架,將影像辨識演算法整合進 Web 互動網頁中
  • 遷移學習實務:運用 VGG16 進行特徵提取與 Fine-tuning,縮短模型訓練週期並提升精準度
  • 高階物件偵測:精通 YOLO 系列模型,從資料標註(Roboflow)、訓練到即時物件追蹤與分類
  • 人體姿態估測:利用 MediaPipe 實現人臉特徵、手勢辨識與 3D 骨架追蹤,開發手勢控制系統
  • 自動化文件辨識:應用 EasyOCR 與 DocTR 技術,實現自動化影像轉文字及文件的版面分析切割
  • 具跨模組整合能力,將影像辨識、追蹤、分類與文字分析應用於實際情境
實作專案 綜合專題與模型部署

課程體驗諮詢