7월 10일 기가지니 데브 컨퍼런스에 다녀왔다. 음성기반 기가지니에 대해 많은 관심이 있었고 그로 인해 유익한 강의를 들어 볼 수 있었다.
들었던 내용을 요약해 두었다. 몇달이 지난 후에 올리는 것이라 기억이 잘 나진 않지만 최대한 글 써놓은 것을 바탕으로 정리했다.
kt cloud 서비스는 규제특화 클라우드로 차별성 강화 하고 4차산업기반강화 해왔다.
KT클라우드 특징 : 고성능 서버, ssd Disk ,저렴한 비용 ,보안성 hybrid cloud를 이용할 수 있다. isms인증을 받았다
GPU computing는 꼭 써야하는 기술로 변화하고 있다 GPU기술 개발자 늘어나고 있다. 2003 년대비 15배 커지고 있다. 향후 100배 정도 커질 예정 수요, 마켓이 커지고 있다. 미래에는 십만대의 데이터 센터 gpu 서버가 필요할 것이다. 또한 AI 딥러닝을 위한 데이터 서버 새로 만들어 나가야 한다.
AI 3대요소
1.빅데이터(big data)
-> 50 zettabyte created 2020 (kt는 데이터를 가지고 있는 장점이 있음)
2.새로운 알고리즘(new algorithm) -> massively Parallel Delivering superhuman accuracy
기존의 전통적인 방식말고, 새로운 알고리즘이 몇천개씩 늘어나고 있다.
3.Modern compute
수천개의 core 가 있어야 한다. + 개발자들이 많이 양성 되어야 한다.
그러나?
데이터 과학자들이 부족하다.
DGX1,2 15days -> 1.5days
NVIDIA
게임 + vr이 90퍼 차지 + AI&HPC—> ( 늘어나고 있다 90퍼GPU기반 ) + self driving car —> ( 아주 일부분 10년 걸려야 도달함)
이렇게 아주 복잡하다 But specialized 한다면 미래전망은 좋다!
현재 + 미래를 바라보고 있음!
TensorRT4
kubernetes -> gpu 할당을 flexible 하게 만들 수 있다.
하나의 프레임워크 여러가지 애플리케이션이 탑재가 된다.
AI CITY 와 5G 상용화를 통해서 발전 할 수 있다.
케이뱅크 음성뱅킹 서비스
금융
민감한정보 까다롭고 불편하기때문에 쉽고 편안하게 제공하기위해 기획했다. -> 카우치뱅킹 : 쇼파에서 티비보다가 계좌잔액 보고싶을때 이용할 수 있는 방법
음성 기반으로 기가지니 단말을 통해서 리모턴을 들고 티비를 보면서 음성으로 잔액조회등 이체할 정보를 모바일 앱으로 보낼 수 있는 기능을 제공한다.
그러나 마지막 이체는 마지막에 스마트폰에서 컨펌하게끔 만들었다. 그 이유는 아직 생체정보로 인증하려면 음성정보는 정확성 신뢰성이 떨어지기 때문.
바이오 -> 본인거부율(본인이인증) 타인수락율(남이 생체정보를 했을때 )에 있어서 음성은아직 발전 단계이다.
그래서 음성으로 기가지니 계좌연결해줘 발화시 바로 스마트폰으로 푸쉬연결을 하게 된다.
기가지니는 output은 티비를 통해서 화면으로 볼 수 있고 input 은 음성과 리모콘을 이용해 사용할 수 있도록 해놓았다.
그런데, 여러명이 기가지니를 사용한다면 ? 해당되는 container ID를 이용하여 return 한다. 해당 ID에 맞는 명령어 처리를 가능하게 만들어 놓았다.
** 서비스 개발시 유의사항
1. 글로벌 정책 확인
2. 인터페이스가 리모컨을 통해서 포커스 처리( 예외처리)
3. 오류발생시 원인분석 및 대응 (원인이 어떤부분에 있는지 확인)
4. sdk 수시로 업데이트 (최신 api제공 )
롯데닷컴 4.0 기획 (전자상거래 업체 )
온라인 커머스 업체가 점점더 voice 에 집중하고 있다.
사람과 대화하듯 말하고 원하는 결과를 찾아내는 것이 음성 인터페이스의 핵심!
why?
1. 학습과정 필요없다
2. 멀티태스킹이가능
3. 입력속도가 빠르다
-> 물건을 결제하는 과정이 모바일에서는 힘들다. 이런부분들 말로 끝낸다면 senior 층까지 고객을 확대 해 나갈 수 있다.
2021년 -> 18억명이 사용 할 것 !
계속 동선을 찾아가면서 물건을 찾는 터치와 다르다. <-> 음성
일반스피커는 화면이 없어서 물건을 비교하기 쉽지 않다. 판매하는것에대해 신뢰도를 확보해야한다.
그리고 고객의 intent 를 파악해야한다.
-> 그러기 위해서는? 다양한 한국어 표현 / 외래어 / 추상적 표현 과 어떤브랜드? 어떤용량 ? 얼마 짜리 ? 등 을 고려해야한다.
merlot home IOT + KT GIGA Genie
조명의 무선네트워크를 기반으로 node 를 연결 확장 할 수 있다. 조명은 우리삶에 어디에서나 존재한다.
조명들간의 local 연결을 통해 connectivity solution 을 내재하고 있는 통신 서비스를 조명에 집어넣자!
각각의 조명들 일반전구에 통신 solution 을 심었다. ip망의 접속을 통해서 네트워크 관제 조명들이 각각 디바이스와 연결할 수 있게 만들었음
통신 솔루션 그 이면에는 전구들과 연결되는 서버있으며 서버와 전구들간의 앱클라이언트 존재 한다.
-> 다양한 여러 플랫폼들이 붙을 수 있도록 통로를 뚫어놓는 시스템을 구축
-> api게이트웨이를 통해 여러 interface에 대응 할 수 있게 만듦
-> 각각의 api로 통신을 할 수있도록 시스템을 구축함 (각자의 플랫품 집중해 붙이기만 하면됨 플랫폼 to 플랫폼 형식)
-> (안보이는 부분 access token) 발행해달라고 서버에 요청 토큰제공해서 모든 리소스들을 엑세스 할 수 있도록 구현( 표준화되어있는 방식 )
-> RESTful API를 통해 기가지니와 merlot간 device 동기화 및 기기제어
GiGA Genie Assistant 지능형 대화 비서
주변의 사물과 이야기하는 assistant로써 —> ambient UX 로 이뤄나가겠다.
최종목표는 ambvient UX - > 위치제약없이 사용할 수 있도록 만들겠다.
음성화상인식등 주변인식을 통해 사용자가 뭘의미 하는지 해석하고 그를 통해 어떤응답을 하고 어떻게 표현하는지 알아낼수 있도록 만드는 목표를 가지고 있다.
dialogue system
대화 해석을 하기 위해서는 전처리 등 필요하다.
핵심적인 부분 —> 그림에 있는 것 판단해서 프레임 구조로 판단하는것 증요하다.그리고 domain knowledge network에 기반하여 목적 질의해석 하여 사용할 수록 성장하는 지식 또한 중요하다.
giga genie 대부분은 media agent & 감성채팅이다.
question answering -> 사용기간에 질문들어오면 대답하는 것 / 어떤 지식을 원할때 —> 질의응답system으로 이어진다.
ex> 지식개발의 Q/A - “ 한효주 대표작이 뭐야 ? “ -> 대답을 찾아간다. 그래서 지식을 잘 구축해야 한다.
linked open data에서 정보를 가져다가 정제해서 집어넣어야한다. -> 언제까지 집어넣야하는가? -> linked에서 -> knowledge으로 집어넣어야한다.
인공지능 생태계(kt ecosystem)
기가지니는 다른 스피커와 다르게 iptv하고 연결할 수 있다는 장점이 있다.
기가지니 진화방향 -> 100만가입자 ~ 150만목표
AI technology 를 통해 고유기술 강화 하고
AI Device를 통해서 device 확장해나간다
롯데쇼핑 케이뱅크 야나두, 지마켓 ,팟빵 등등 과 같이 다양한 회사들 기술을 섞어서 협력 해야한다.
kt 생태계확대하기 위해 노력해야한다. (AI kits Cloud API)를 이용해서
AI makers kit -> 디바이스를 만들 수있는 도구
AI academy -> 개발할 수 있는 개발자들 human resoures
- AI kits cloud api —> 실질적으로 쉽게 만들어 나가는 service SDK /coud API(voice translation )향후 tts vedic chatbot api 등등 공개예정이다.
- AI makers kit - > 라즈베리파이를 이용하여 연계할 수 있는 도구
- academy -> kt AI Academy GIGA Geine AI Kit 개발교육
AI Everywhere 환경을 만들어 나가는 목표
'컨퍼런스&전시회' 카테고리의 다른 글
if(kakao) dev 컨퍼런스 (0) | 2018.11.25 |
---|---|
삼성SDS Techtonic 2018 (0) | 2018.11.24 |