AI 50

[CV 논문] AutoSplat: Constrained Gaussian Splatting for Autonomous Driving Scene Reconstruction

아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다. 읽은 논문들 정리[목차]지속적으로 업데이트 중, 번호는 모델발전 순서가 아닌 읽은 순서에 따라 정렬.1. Computer Vision 분야 논문Classification 모델들의 발전Detection 모델들의 발전Segmentation3D 처리2. Natural Language Processapril2901.tistory.com 기존의 3DGS를 사용한 자율주행 장면 재구성에서는 몇가지 문제가 있었다.기본적으로 정적인 장면을 가정하고,카메라 뷰가 제한되어있으며,배경들에 대한 제약이 없었다. 논문에서는 이런 이유들 때문에 상당한 퀄리티 감소가 있었다고 얘기한다. 3DGS계열 자율주행 복원에서 PVG, Driving Ga..

[CV 논문] SplatAD: Real-Time Lidar and Camera Rendering with 3D Gaussian Splatting for Autonomous Driving

아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다. 읽은 논문들 정리[목차]지속적으로 업데이트 중, 번호는 모델발전 순서가 아닌 읽은 순서에 따라 정렬.1. Computer Vision 분야 논문Classification 모델들의 발전Detection 모델들의 발전Segmentation3D 처리2. Natural Language Processapril2901.tistory.com 이번 논문은 SplatAD라고 부르는 논문이다.새로운 시점에서의 이미지만 만들던 이전 논문들과 달리 이 논문은 라이다 데이터도 만든다.이전 연구들을 보면 NeRF기반 모델에서는 라이다 데이터까지 만드는 것들이 있었다.대표적으로 이 블로그의 글로도 썼던 UniSim이 있다.더 단순화된 네트워크와..

[CV 논문] HUGSIM: A Real-Time, Photo-Realistic and Closed-Loop Simulator for Autonomous Driving

아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다.읽은 논문들 정리 이번 논문은 최근 내 관심사와 매우 유사한 논문이다.3DGS를 사용하여1. 실시간 렌더링 가능2. 사실적3. close loop를 가능하게 하는 자율주행 시뮬레이터를 고안한 논문이다.좀 자세하게 읽고 글을 써보려한다. 이전 연구들먼저 기존의 static scene 구성 방법을 point-based, mesh-based, NeRF-based, 3DGS-based로 나눠 방법들을 먼저 정리해준다.포인트와 매쉬 기반은 재구성은 잘하지만 고품질로 모델링 하는데 문제가 있다.NeRF기반은 고품질 모델링과 새로운 시점에서의 렌더링을 가능하게 한다.3DGS기반은 실시간 렌더링까지 지원한다. dynamic scene..

Waymo 데이터셋을 직접 전처리해서 street gaussian학습/평가해보기

이전글에서는 street gaussian 저자들이 이미 모든 전처리를 다 해놓은 데이터셋을 받아 학습을 돌려봤었다. Street-gaussian 학습환경 세팅 & 학습시켜보기[CV 논문] Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다. 읽은 논문들 정리[목차]지속적으로 업데이april2901.tistory.com 이번에는 raw한 웨이모 데이터셋 그 자체를 받아 직접 처리를 하여 돌려보자. 기본적으로 이전 글의 내용에서 추가적으로 이어진다고 생각하면 좋다.(환경, 설치 패키지 등)웨이모 데이터셋 다운로드웨이모 데이터셋은 google clou..

[CV 논문] StreetSurf: Extending Multi-view Implicit Surface Reconstruction to Street Views

아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다. 읽은 논문들 정리[목차]지속적으로 업데이트 중, 번호는 모델발전 순서가 아닌 읽은 순서에 따라 정렬.1. Computer Vision 분야 논문Classification 모델들의 발전Detection 모델들의 발전Segmentation3D 처리2. Natural Language Processapril2901.tistory.com 이번 논문은 StreetSurf라는 논문이다. 자율주행 데이터셋들을 보면 NeRF, 3DGS같은 기술과는 다르게 물체를 카메라가 한 바퀴 빙 둘러 모든 방면의 사진을 찍는 것이 아니다.차가 움직이는 그 궤적에서 찍기 때문에 관측 각도가 제한적이다.또 NeRF, 3DGS는 물체나 장면 하나에 ..

[CV 논문] UniSim: A Neural Closed-Loop Sensor Simulator

아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다. 읽은 논문들 정리[목차]지속적으로 업데이트 중, 번호는 모델발전 순서가 아닌 읽은 순서에 따라 정렬.1. Computer Vision 분야 논문Classification 모델들의 발전Detection 모델들의 발전Segmentation3D 처리2. Natural Language Processapril2901.tistory.com 이번 논문은 UniSim이라고 불리는 모델에 대한 설명이다.자율주행 학습에서 시뮬레이션을 하는데 유용하게 사용될 수 있다.자율주행 모델에게 어떤 주행 영상을 주고 액션을 취하라고 하는 상황을 생각해보자.주어진 영상 속의 어느 지점에서 차가 영상에서 나오는 행동과 다른 행동을 했다면 어떻게 될..

Street-gaussian 학습환경 세팅 & 학습시켜보기

[CV 논문] Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다. 읽은 논문들 정리[목차]지속적으로 업데이트 중, 번호는 모델발전 순서가 아닌 읽은 순서에 따라 정렬.1.april2901.tistory.com3DGS환경세팅처럼 이 street-gaussian의 학습환경을 세팅할 때 고통받고 있는 사람이 많을 것이다.나도 역시나 한번에 세팅이 되지 않았다. 성공한 세팅방법을 공유하려한다.추가로, 성공한 세팅에서 학습까지 시키는 과정이 글에 나와있다. OS : Ubuntu 22.04 LTS가상환경 툴 : anaconda 다른 툴들은 모두 다시 깔 ..

[CV 논문] Street Gaussians: Modeling Dynamic Urban Scenes with Gaussian Splatting

아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다. 읽은 논문들 정리[목차]지속적으로 업데이트 중, 번호는 모델발전 순서가 아닌 읽은 순서에 따라 정렬.1. Computer Vision 분야 논문Classification 모델들의 발전Detection 모델들의 발전Segmentation3D 처리2. Natural Language Processapril2901.tistory.com 이번 논문도 이전의 Driving Gaussian처럼 주행 뷰를 렌더링하는 방법에 대한 논문이다. 기존 방법들보다 엄청나게 빠른 속도와 적은 학습시간만이 소요된다.또 객체별로 모델링되어 있어 조작이 편하다. Street Gaussians이전 Driving Gaussian과 마찬가지로 배경 + ..

[CV 논문] DrivingGaussian: Composite Gaussian Splatting for SurroundingDynamic Autonomous Driving Scenes

아래 글에서 이 블로그에서 리뷰한 논문들의 흐름과 분야별 분류를 한 눈에 볼 수 있다. 읽은 논문들 정리[목차]지속적으로 업데이트 중, 번호는 모델발전 순서가 아닌 읽은 순서에 따라 정렬.1. Computer Vision 분야 논문Classification 모델들의 발전Detection 모델들의 발전Segmentation3D 처리2. Natural Language Processapril2901.tistory.com 간단요약이번 논문은 빠른 속도와 넓은 범위를 다뤄야하는 자율주행에서 장면 합성을 하는 것에 대한 논문이다.기본적으로 배경과 물체를 구분하는데, 배경은 고정시키고 물체만 움직이는 방식으로 합성하는 방식을 사용한다.처음 가우시안을 초기화할 때는 기존 3DGS에서 썼던 COLMAP이 아닌 LiDAR..