본문 바로가기

분류 전체보기102

NeurIPS 2022 Conference Comment(후기) in New Orleans, USA NeurIPS (Neural Information Processing Systems) NeurIPS는 올해로 36주년을 맞았으며 2022년에 총 2905편의 논문을 accept 하고 약 10,000여명의 사람이 학회장으로 모이는 국제 최대 AI 학회이다. 내가 지금껏 다녔던 Machine Vision 혹은 HW IC Chip 학회와는 규모가 족히 2배이상 차이난다. 특히나 구글, 애플, 아마존, Meta 등 자원이 빵빵한 기업들도 함께 paper를 쓰고 따로 기업 부스를 열어 그들의 AI 기술과 관련 인턴쉽 홍보도 하기에 분위기는 더 달아오른다. 여담으로 paper author를 대상으로 기업별 social dining도 있다. 나는 이번 학회에 논문을 따로 내지 않았기에 그 내막을 자세히 알진 못하지만.. 2022. 12. 5.
[뉴스 스크랩] 점점 커져가는 초거대 NLP AI 모델들의 크기 초거대 AI 모델 2020년 이전에는 NLP 모델 중에서 거대한 크기의 모델이 없었다. CNN 모델에 비하여 파라미터 수가 현저히 낮은 작은 크기의 모델만 존재하였다. 그러다 2020년 6월 OpenAI가 'GPT-3'라는 transformer 기반의 NLP 모델을 발표하면서 판을 뒤집었다. 초거대 AI 모델의 의미 모델의 크기가 커진다는 것은 어떤 의미일까? 모델의 크기, 즉, 학습된 신경망의 규모는 신경망이 가진 파라미터(parameter, 매개변수) 수로 측정할 수 있다. 개략적으로 말해서 AI 모델의 파라미터 수가 많을수록 모델이 학습 데이터에서 더 많은 정보를 받아들일 수 있고, 새로운 데이터에 대해서도 더 정확한 예측을 할 수 있다는 의미이다. 대분류 모델 명 Parameter(매개변수) 수 .. 2022. 3. 15.
AI반도체에 가장 많은 투자를 하는 IBM, 10년을 바라보며 투자 중 AI반도체에 가장 많은 투자를 하는 IBM 10년을 바라보며 투자 중 IBM은 인간의 뇌신경 구조와 기능을 모방해 만든 뉴로모픽 반도체 분야에서 가장 앞선 기업으로 꼽힌다. 올바니연구소에선 수백 명의 연구원이 IBM 핵심 제품인 메인프레임 서버, AI 플랫폼 등에 활용할 AI반도체를 연구하고 있다. 연구용 초대형 팹(fab: 반도체 제조시설)만 다섯 개에 달한다. 세계에서 가장 뛰어난 성능을 보유한 뉴로모픽 반도체로 불리는 ‘트루노스(TrueNorth)’도 이곳에서 탄생했다. 삼성전자뿐 아니라 ASML, 도쿄일렉트론, 어플라이드머터리얼스 등 세계적 장비회사도 이곳에서 IBM과 공동 연구를 진행 중이다. 목표는 '무어의 법칙' 미세 공정을 성공하여 충전 성능 향상 IBM과 삼성전자가 올버니연구소에서 공동개.. 2022. 1. 3.
[Pytorch 프로젝트] CNN(Convolutional Neural Network)으로 MNIST 데이터 분류하기 🔊 해당 포스팅에서 사용된 컨텐츠는 위키독스의 PyTorch로 시작하는 딥러닝 입문 내용을 기반으로 했음을 알립니다. 설명에서 사용된 자료는 최대한 제가 직접 재구성한 자료임을 알립니다. 포스팅은 CNN(Convolutional Neural Network) 기법을 이용하여 MNIST 데이터를 분류하였다. 같은 MNIST 데이터로 softmax regression과 MLP(multi-layer perceptron) 방식으로도 MNIST 데이터를 분류하였으니 참고하면 좋다. 2021.10.24 - [AI | 딥러닝/Project] - [Pytorch] Softmax regression으로 MNIST 데이터 분류하기 2021.10.24 - [AI | 딥러닝/Project] - [Pytorch 프로젝트] MLP.. 2021. 10. 25.
[Pytorch 프로젝트] MLP(Multi-Layer Perceptron)으로 MNIST 데이터 분류하기 🔊 해당 포스팅에서 사용된 컨텐츠는 위키독스의 PyTorch로 시작하는 딥러닝 입문 내용을 기반으로 했음을 알립니다. 설명에서 사용된 자료는 최대한 제가 직접 재구성한 자료임을 알립니다. 아래 포스팅은 Softmax regression 기법을 이용하여 MNIST 데이터를 분류하였다. 아래 방식과 차이점을 비교하여 이번 포스팅을 보면 훨씬 이해하는 데 도움이 될 것이다. 2021.10.24 - [AI | 딥러닝/Project] - [Pytorch] Softmax regression으로 MNIST 데이터 분류하기 사용 Framework: Pytorch 사용 기법: MLP(Multi-Layer Perceptron) 사용 함수: nn.Sequential() 사용 데이터: MNIST (손글씨 숫자) 모델링을 할 .. 2021. 10. 24.
[Pytorch 프로젝트] Softmax regression으로 MNIST 데이터 분류하기 🔊 해당 포스팅에서 사용된 컨텐츠는 위키독스의 PyTorch로 시작하는 딥러닝 입문 내용을 기반으로 했음을 알립니다. 설명에서 사용된 자료는 최대한 제가 직접 재구성한 자료임을 알립니다. 사용 Framework: Pytorch 사용 기법: Softmax regression 사용 함수: nn.Linear() 사용 데이터: MNIST (손글씨 숫자) 모델링을 할 때 크게 4가지 틀을 기억하고 지켜주면 된다. 1. Dataset 설정 2. 모델 설계 3. Cost 함수와 Optimizer 설정 4. Training 과 Back-propagation 수행 모델링 (Modeling) import torch import torchvision.datasets as dsets import torchvision.tran.. 2021. 10. 24.
[AI/딥러닝] 진정한 딥러닝을 위한 3가지 분류 (Classification, Object Detection, Image Segmentation) 3탄 진정한 딥러닝을 위한 3가지 분류 마지막 시리즈 이다. Classification과 Object detection에 관한 내용은 아래 1탄과 2탄을 참고하면 좋다. 2021.08.31 - [AI | 딥러닝/Concept] - [AI/딥러닝] 진정한 딥러닝을 위한 3가지 분류 (Classification, Object Detection, Image Segmentation) 1탄 2021.09.09 - [AI | 딥러닝/Concept] - [AI/딥러닝] 진정한 딥러닝을 위한 3가지 분류 (Classification, Object Detection, Image Segmentation) 2탄 이번 포스팅에서는 마지막 남은 한 가지 'Image segmentation'에 대해 알아볼 예정이다. Segmentat.. 2021. 9. 19.