- Deep learning accelerator기반 neural network 성능 최적화
- Quantization, pruning, quantizationaware training 등 최적화 방법 활용 이런 분을 찾습니다. [필요역량 및 직무경험]
- Deep learning algorithm 개발 및 최적화 경험
- Neural network 최적화 경험 (Quantization, graph optimizations, low level optimization)
- Deep learning 기반 다양한 응용 SW 및 서비스 개발, 상용화 경험
- SIMD/VLIW 기반 embedded processor SW 최적화 [자격요건] 학력 : 석사 이상
- TensorRT/Deepstream 경험자 우대
- Linux 기반 응용 또는 시스템 소프트웨어 개발 역량
Deep Learning Inference Engineer - Seo-gu, 대한민국. - SAPEON Korea
설명
이런 일을 합니다. 다양한 neural network 알고리즘들을 custom deep learning accelerator에 porting 하고 최적화합니다.Layer별, accelerator function block별 performance analysis를 수행하고 다양한 최적화 방법을 적용하여 성능 및 전력소모를 최적화 합니다.
Quantization, pruning을 포함한 다양한 최적화 방법을 활용하며, training 과 inference 모두에 대해 최적화 합니다.
음성, 영상, 자연어, 추천 등 다양한 응용에 적용하고, 성능 뿐 아니라 서비스가 요구하는 특성에 맞춰 최적화 합니다.
응용개발 및 서비스를 수행하는 고객사와 원활한 communication 이 필요합니다.
[주요 수행업무 및 역할] - Neural network algorithm의 deep learning accelerator porting
더욱 좋습니다. [우대사항] - C/C++ 또는 Python에 대한 깊은 이해 및 능숙한 개발 능력