[AITech] 20220204 - 회고

4 minute read


회고

이번 주는 설날 연휴로 목/금 이틀만 교육을 받고 3주차를 마무리하였다.

이번주부터는 데이터 시각화에 대한 학습을 진행하였다. 솔직히 처음에는 ‘데이터 시각화’란 데이터를 시각적으로 표현하는 것에만 그치고, 그 의미와 사용 목적에 대해 잘 알지 못했기 때문에 크게 와닿지 않는 부분들도 있었다.

하지만 강의를 듣고, 마스터 클래스를 진행하면서 시각화의 의미에 대해 깊이 알 수 있었고 시각화란 단지 하나의 독립적인 분야로서가 아닌 HCI나 UX와의 활용 측면에서 그 의미가 극대화될 수 있다는 것을 느꼈다.

최근 AI와 HCI 간의 융합과 그 연구에 관심이 생겼는데, 이번 주 교육을 통해 그 의미에 대해 조금 더 알아가고 시각화를 진심으로 대할 수 있는 계기가 되었던 것 같다.

데이터 리터러시와 시각화

  • 어떤 개발자가 되어야 하나?
    • 개발과 연구는 혼자 하는게 아니다. 개인은 시간과 능력에 한계가 존재한다.
    • (좋은 집단으로 가면) 코딩을 잘하는 개발자는 많다.
    • 순위와 실력은 유지하기 어렵다.
  • 지속 가능한 개발자란 Expert를 support하고, 대다수의 beginner를 끌어줄 수 있어야 한다.
    • 내 분야에서 내가 하고 싶은 개발을 해야 한다.
  • 어떤 개발자가 될 것인가?
    • 기술 중심
      • 협업에서 실력이 없는 것은 죄다. 반드시 실력 지향.
      • 하지만 나의 실력은 무엇으로 증빙할 수 있을까?
        • 학위? 자격증? 이력서? 코딩테스트?
      • 문제를 잘 푸는 것보다 문제를 제기할 수 있어야 한다.
    • 인간 중심
      • Communication: 개발자에게 필요한 소통은 무엇이 있을까? 전하고 싶은 내용을 명확하게 전달하는 방법?
      • Branding: 노력과 실력을 어필하는 방법은 무엇이 있을까? 비슷한 내용이면 포장으로 차이를 낼 수 있다.
      • Vision: 내 기술은 세상에 기여할 수 있는 지식이낙? 기술이 ‘기술만을 위한 기술’로 남지 않기 위해서는?
  • 데이터 리터러시
    • 모든 것을 결합하여 생각한 데이터의 본질
    • 데이터를 건전한 목적과 윤리적인 방법으로 사용한다는 저제 하에, 현실 세상의 문제에 대한 끊임없는 탐구를 통해 질문하고 답하는 능력
      • 좋은 질문, 필요한 데이터 선별, 결과 판별, 의사결정자가 이해할 수 있을 만한 정리, 스토리텔링
  • 데이터 시각화
    • 데이터를 이쁘게 보여주는 것? => 데이터를 필요에 맞게 시각적 요소로 변환하여 이해하기 쉽게 시각적으로 전달
      • Data manipulation & Encoding
      • Goal & Target Audience
      • Prevent Misleading
      • Observation & Aesthetic
    • Data Visualization 종류
      • Information Visualization(Viz)
        • 기존 데이터의 통계치 등의 정보를 시각적으로 전달
      • Scientific Visualization(Sci graphics)
        • 이미지, 오디오, 3D 객체 등의 객체 관찰 또는 시뮬레이션을 효과적으로 살피기 위한 시각화
      • Infographic
        • 전달하고나 하는 메시지를 데이터를 통한 스토리텔링으로 전달
      • Data Art
        • 데이터를 사용하여 예술적으로 표현
  • 데이터 사이언스에서 시각화가 중요한 이유
    • 블랙박스
      • 데이터를 많이 넣고, 모델을 깊이 쌓으니 된다?
      • 결과에 대한 신뢰도는 성능 100%가 아닌 한 부족하다.
      • 결과 중심이 되서는 안된다!
    • 임지 정보는 많다! 하지만 단순히 많기만 한 정보는 의미가 없다.
      • 성능과 적절한 하이라이트
      • 이미 기업에는 80%가 블랙 데이터다.
    • 데이터 사이언스에서 시각화를 하는 이유
      • 시각화를 하는 과정에서 데이터를 살피며 데이터에서 인사이트 얻기
      • 결과를 효과적으로 보여주기
        • 데이터 중심 커뮤니케이션을 위해서는 단순히 정보만으로는 불가능
        • 의사결정자에게 더 핵심적으로 정보를 전달하기
        • 설득의 핵심은 이성+감성+신뢰!
  • AI Production에서 시각화가 중요한 이유
    • 데이터를 사용한 설득
      • 의료, 경제 등 실질적 손실이 가는 분야일수록 신뢰가 필요
      • 기계가 하는걸 어떻게 믿어요?와 사람이 하는 걸 어떻게 믿어요?의 커넥션
    • Metric에 따라 높은 Score를 가지만 좋은 AI Model일까?
      • 기본적인 성능과 안전성은 필수
      • 그 다음은 Product이고, 그 때부터는 UX!!
      • 제한적인 환경에서 최대한으로 보여줄 수 있어야 한다.
      • 시각화는 UX의 다양한 고려점 중 하나이자 좋은 연습 도구
  • 데이터 시각화에서 UX/UI까지…
    • 어느 정도 기술과 시각적 수준을 확보하고 나면 사용자가 사용하기 편리함이 중요하다!
    • 논문: Visual Analytics in Deep Learning
    • Why?
      • 해석 가능하고 설명가능한 인공지능을 위해
      • 모델을 비교하고 선택하기 위해
      • 모델을 디버깅/모델의 성능을 향상하기 위해
      • 딥러닝 이론을 가르치기 위해
    • When?
      • 훈련 전: 데이터를 살피는 단계
      • 훈련 중: 데이터가 잘 훈련되고 있는지
      • 훈련 후: 결과를 어떻게 잘 해석할 것인가? 결과를 어떻게 잘 전달할 것인가?
    • Who?
      • 전문가: 더 나은 모델을 개발하기 위한 분석 방법/발표
      • 비전문가: 실사용자 또는 실제로 적용시키는 담당자
    • How?(핵심!)
      • 방법론 -> 인지적 관점 -> 구현
  • 이 내용은 꼭 가져가기!!!
    • 새로운 데이터를 보고 빠르게 파악하기
      • 데이터를 wrangling하고 시각화까지 연결하기
    • 시각화로 원하는 정보를 강조 및 전달
    • 오용 및 남용하지 않기
      • 오용하지 않으면서 이쁜 시각화란?
      • 시각화 올바르게 해석하기(읽기)
    • 필요한 시각화와 필요없는 시각화를 구분


FAQ

  • 개인이 이해하는 정도가 다른데, 어떤 근거로 특정 시각화 폼을 사용하는지?
    • 타겟 청자를 미리 파악, 어떤 정보를 궁금해할 지에 대한 시나리오(페르소나)를 작성
    • 연구의 경우, 인터뷰 진행, 표현의 목적에 대해 사전 조사
  • 시각화 과정에서 가장 힘든 부분은?
    • 단순히 텍스트 할 줄로 전달할 수 없을까?
    • 굳이 시각화가 필요할까? 어떤 걸 얼만큼 사용해야 할까?
  • Tableau와 비교해서 파이썬으로 시각화하는 것의 장점은?
    • 파이썬, matplotlib이 익숙하지 않다면 Tableau가 편리하고 deplyment가 편리
    • 파이썬은 시시각각 변하는 데이터, 결과의 향상이 필요한 상황에서 매우 좋음
  • 시각화하는 방법과 가장 시너지가 잘 날 수 있는 공부 혹은 프로젝트가 무엇이 있을까요?
    • 캐글 가서 EDA??
    • 마음에 드는 시각화 researcher 들을 follow해서 그들이 한 시각화를 내가 얼마나 할 수 있을까? 나는 어떻게 생각하는가?
  • 어려운 알고리즘 문제를 만났을 때 어느정도 시간을 잡고 고민하는지?
    • 유형이 일정화되어 있기 때문에 코딩 테스트 시간 정도 잡고 꾸준히 풀기
    • 비슷한 다른 문제를 풀어보기
    • 답을 보고 일주일 뒤에 다 까먹었을 때 다시 풀기
  • 캐글을 처음 시작했을 때 어느 것부터 시작해야 할지?
    • 대회 목적에 대한, 데이터에 대한 충분한 생각
    • 국내 실력자들의 가이드
  • 데이터 시각화/분석 기술 하나만으로 취업 시장에서 경쟁성이 있나요?
    • 1등이 아닌 이상 절대 아니다. 단, 해외의 데이터 저널리즘 같은 경우 가능
    • 데이터 시각화를 공부하다 보면 데이터에 대한 분석 능력이 길러진다
    • 똑같은 실력을 가지고 있다면 시각화를 잘 하는 것이 경쟁력
  • matplotlib, seaborn 외에 괜찮은 시각화 툴?
    • 인터랙티브 툴: plotly, altaer
  • 시각화 관련하여 랩실을 선정할 때 어떻게 했는지? 데이터 시각화 전문가로서 로드맵?
    • AI를 어떤식으로 UX적으로 접근할까?
    • 네이버든, 카카오든 ai researcher는 정말 많다. 성능도 좋음에도 불구하고 성능과 인식은 다르다.
      • ex) AI 스피커의 성능이 좋음에도 불구하고 사용자는 그게 필요한지, 어떻게 쓰는지 잘 모른다.
    • 문제를 제시하고 해결하는 과정을 위해 대학원 진학!
    • 데이터 시각화만을 전문으로 하기 보단, UX적인 연구를 하겠다. 그리고 교육적인 전파.
  • HCI는 간단하게 무엇인지, 무엇을 하는지, HCI와 AI 분야간 학제적 연구
    • HCI: 사람과 컴퓨터 간 소통에 관한 모든 것
    • UX 적 연구가 활발. 어떻게 하면 computer들에 적용?
      • 예를 들면 사람이 어떤 도구를 사용하고 만족하는지 연구
        • 유용성: 실제로 어떤 목적을 달성?
        • 사용성: 얼마나 편리한가?
        • 감성: 나에게 감성적으로 어떻게 다가오는가?
    • AI와의 학제적 연구
      • 사람 중심으로 사용했을 때 어떤 영향, 어떤 감정?
      • 어떤 것들이 필요하고 어떻게 적용할 수 있을지
      • 어플리케이션 위주

Categories: ,

Updated:

Leave a comment