[by @anpigon] ONNX Runtime으로 모바일 AI 앱 개발하는 방법

in kr-dev 커뮤니티3 months ago

원본 글 보러가기 : ONNX Runtime으로 모바일 AI 앱 개발하는 방법

작성자 : @anpigon 미리보기 (5 sentences)


모바일에서 LocalLLM으로 동작하는 모바일 앱을 개발하려면 ONNX Runtime을 사용할 수 있습니다. ONNX Runtime을 사용한 모바일 AI 앱 개발 과정은 다음과 같은 단계로 진행됩니다.

  1. 모델 확보: 먼저, 모바일 애플리케이션의 시나리오에 적합한 ONNX 형식의 모델을 확보해야 합니다. 예를 들어 이미지 분류, 비디오 스트림에서 객체 감지, 텍스트 요약 또는 예측, 수치 예측 등을 위한 모델이 필요합니다. ONNX 모델은 ONNX 모델 줌에서 가져올 수 있으며, PyTorch, TensorFlow 등의 다른 형식의 모델을 ONNX 변환기를 사용하여 ONNX 형식으로 변환할 수 있습니다.
  2. 애플리케이션 개발: 모델을 확보했다면, ONNX Runtime API를 사용하여 모델을 로드하고 실행할 수 있습니다. 사용할 언어 바인딩과 런타임 패키지는 개발 환경 및 타겟 플랫폼에 따라 달라집니다.
  3. 애플리케이션 성능 측정: 개발된 애플리케이션의 성능을 타겟 플랫폼의 요구 사항에 따라 측정해야 합니다. 측정 항목에는 애플리케이션 바이너리 크기, 모델 크기, 애플리케이션 지연 시간, 전력 소비 등이 포함됩니다.
  4. 애플리케이션 최적화: 애플리케이션이 요구 사항을 충족하지 못하는 경우 최적화를 수행할 수 있습니다. 모델 크기 감소, 애플리케이션 바이너리 크기 감소, 실행 프로바이더 선택 등의 최적화 방법이 있습니다.

더 보기 에서 확인 하실 수 있습니다.


[광고] 개발자 커뮤니티에 참여하세요 - 개발자 커뮤니티에 참여 하면 다양한 혜택을 받을 수 있습니다. 참여방법

Coin Marketplace

STEEM 0.16
TRX 0.16
JST 0.030
BTC 58092.36
ETH 2469.79
USDT 1.00
SBD 2.38