목록전체 글 (35)
Altiora Petamus
이 논문은 객체 감지를 위한 Fast Region 기반 cnn 방법을 제안한다. fast r cnn은 심층 cnn을 사용하여 객체 제안을 효율적으로 분류하기 위해 이전 방식을 기반으로 한다. 이전 방식와 비교하여 Fast R-CNN은 R-CNN보다 매우 깊은 VGG16 네트워크를 9배 더 빠르게 훈련시키고, 테스트 시간에서 213배 더 빠르며, PASCAL VOC 2012에서 더 높은 mAP를 달성한다. SPPnet에 비해 Fast R-CNN은 VGG16을 3배 더 빨리훈련시키고 ,10배 더 빠르게 test를 진행하며 더 정확하다. Fast R-CNN 은 python 과 c++에서 caffe를 통해 구현이 가능하다.
우세한 시퀀스 변환 모델은 인코더와 디코더를 포함하는 복잡한 recurrent 또는 cnn을 기반으로 한다. 또한 가장 성능이 좋은 모델은 attention 메커니즘을 통해 인코더와 디코더를 연결한다. attention 메커니즘에만 기반한 새로운 간단한 네트워크 아키텍처인 Transformer를 제안한다. 두 가지 기계 번역 작업에 대한 실험은 이러한 모델이 더 병렬 가능하고 훈련 시간이 훨씬 더 적게 요구되면서도 품질이 우수하다는 것을 보여준다. 이 논문에서 제시한 모델은 WMT 2014 영어-독일어 번역 작업에서 28.4 BLEU를 달성하여 앙상블을 포함한 기존 최상의 결과보다 2배 이상 성능이 향상되었다. WMT 2014 영어-프랑스어 번역 작업에서, 제시된 모델은 8개의 GPU에서 3.5일간 학습..
mapreduce는 대규모 데이터 세트를 처리하고 생성하기 위한 프로그래밍 모델이자 관련 구현체이다. 사용자는 key/value 쌍을 처리하여 중간의 key/value쌍을 생성하는 map fucntion을 지정하고 , 동일한 중간 키와 연결된 모든 중간 값을 병합하는 reduce function을 지정한다. 이 논문에서 보여주듯이 이 모델을 이용하여 real world에 대한 실제 작업을 수행할 수 있다. 이러한 기능적인 방식으로 만들어진 프로그램은 자동으로 병렬화 되어 대규모 범용 머신 클러스터에서 실행된다. 런타임 시스템은 입력 데이터의 파티셔닝, 컴퓨터 세트 전반에 걸친 프로그램 실행 스케줄링, 기계 고장 처리 및 필요한 기계 간 통신 관리의 세부 사항을 처리합니다. 따라서 병렬 및 분산 시스템에 ..
text to image generation은 전통적으로 고정 dataset 학습을 위한 더 나은 모델링을 추정하는데 중점을 두었다. 이러한 추정은 훈련 중에 제공되는 복잡한 구조 ,auxiliary losses, 그리고 object part labels와 segmentation masks같은 side information를 포함할 수 있다. 이 논문에서 텍스트 및 이미지 토큰을 데이터의 single stream으로 자동 회귀 모델링하는 transformer를 기반으로 이 작업에 대한 간단한 접근 방식을 설명한다. 충분한 데이터와 규모로, 이 논문에서 제시한 방식은 zero-shot fashion에 대해 평가될때, 이전의 domain-specific models과 비교하면 경쟁력이 있다.
지난 몇 년 동안 표준 pascal voc데이터 세트에서 측정된 객체 감지 성능은 평탄했다. 가장 성능이 좋은 방법은 일반적으로 여러 하위 수준 이미지 기능과 높은 수준의 context를 결합한 복잡한 앙상블 시스템 이었다. 이 논문에서는 voc 2012에 대한 앞서 설명한 앙상블 시스템보다 평균정밀도(mAP)를 30% 이상 향상시켜 53.3%의 mAP를 당성하는 간단하고 확장 가능한 탐지 알고리즘을 제안한다. 이 논문에서 소개하는 핵심적인 방법은 두 가지로 첫번째로 객체를 로컬라이징 및 분할하기 위해 bottom-up region proposals 을 high-capacity convolutional neural networks을 적용할 수 있다는 것이고 두번쨰로 라벨링된 훈련 데이터가 부족할 때 보조..
자연어 이해는 텍스트 수반, 질문 답변, 의미 유사성 평가 및 문서 분류와 같은 광범위한 다양한 작업으로 구성된다. 라벨이 부착되지 않은 대형 텍스트 corpors는 풍부하지만, 이러한 특정 작업을 학습하기 위한 레이블링 데이터가 드물기 때문에 차별적으로 훈련된 모델이 적절하게 수행하기가 어렵다. 이 논문에서는 라벨이 부착되지 않은 다양한 텍스트 corpors에서 언어 모델을 생성적으로 사전 훈련한 후 각 특정 작업에 대한 차별적인 미세 조정을 통해 이러한 작업에 대한 큰 이득을 실현할 수 있음을 보여준다. 이전의 접근 방식과 달리, 우리는 미세 조정 중에 task-aware input transformations을 사용하여 모델 아키텍처에 최소한의 변경만 요구하면서 효과적인 전송을 달성한다. 또한 자연..
양적 투자는 일련의 금융상품에 대한 순차적 거래기간에 수익률을 극대화하고 위험을 최소화하는 것을 목적으로 한다. 최근 양적 투자에서 괄목할 만한 혁신을 창출하는 AI 기술의 빠른 발전과 큰 잠재력에 영감을 받아 양적 연구와 실제 투자를 위한 AI 중심의 워크플로우 채택이 늘고 있다. 양적 투자 방법론을 풍부해지는 한편, AI 기술은 양적 투자 시스템에 새로운 도전을 제기해 왔다. 특히, 양적 투자를 위한 새로운 학습 패러다임은 재구성된 워크플로우를 수용할 수 있는 인프라 업그레이드를 요구한다. 더욱이, AI 기술의 데이터 중심 특성은 실제로 보다 강력한 성능을 가진 인프라의 요구사항을 나타낸다. 또한, AI 기술을 적용하기 위한 재무 시나리오에서 다양한 작업을 해결하기 위해 AI 기술을 적용하기 위한 고..
인간은 생물학적 제한 때문에 주변 환경의 일부와만 상호작용할 수 있다. 따라서, 우리는 일련의 관찰에 걸친 공간 관계를 추론하여 주변 환경을 결합하는 방법을 배운다. 그러한 행동과 기계에도 계산상의 제약이 있다는 사실에 영감을 받아, generateor가 조건에 대한 공간 좌표를 기반으로 부품별로 이미지를 생성하는 CONDitional CONordinate GAN을 제안한다. 반대로 discriminator 는 전역 일관성, 로컬 외관 및 에지 감지 연속성에 의해 조립된 여러 패치에 걸쳐 사실성을 정당화하는 방법을 배운다. 전체 이미지는 훈련 중에 생성되지 않지만, COCO-GAN이 추론 중에 최첨단state-of-the-art-quality의 전체 이미지를 생성할 수 있음을 보여준다. 이 논문에서 네트..
abstract 강화학습 방법의 개발은 algorithmic trading을 포함한 많은 분야로 적용 범위를 넓혔다. 이 논문에서는 증권 거래소의 상태, 행동, 및 보상으로 구성된 Markov 속성을 가진 게임으로 해석된다. 금융상품의 고정된 volume을 거래하기 위한 시스템이 제안되고 실험적으로 테스트된다. 이는 여러 신경망 아키텍처를 사용하는 asynchronous advantage actor-critic method에 기초한다. 이 접근법에서 반복 레이어의 적용을 조사한다. 이 논문에서 실행된 실험은 실제 익명화된 데이터에 대해 수행되었다. 최고의 아키텍처는 연간 66%의 수익성을 가진 RTS Index futures에 대한 거래 전략을 증명하였다.
deep conv networks는 이미지 인식의 성능 향상에서 가장 중심적인 부분이다. 한가지 예로 비교적 낮은 계산 비용으로 매우 우수한 성능을 달성하는 inception아키텍처를 들 수 있다. 최근에는 전통적인 구조와 residual connection의 결합을 도입하는 것은 sota를 달성하였다. 그 성능은 최근 inception v3네트워크와 유사한 성능이었다. 이러한 것들은 resudual connections와 inception architecture 를 연결하는 것이 이익이 되는지에 대한 의문을 일으킨다. 이 논문에서는 resudual connections을 이용하여 훈련시키는 것이 inceptions networks의 훈련을 현저하게 가속화 시킨다는 경험적 증거를 제시한다. 또한 resi..