ChatGPT 는 흐릿한 JPEG of the Web 2/2

in #chatgptlast year

https://www.newyorker.com/tech/annals-of-technology/chatgpt-is-a-blurry-jpeg-of-the-web

위 링크는 ChatGPT에 관한 Ted Chiang의 기고문입니다. 아래는 이 기고문의 파파고 초벌 번역을 수정/정리한 내용입니다.


대형 언어 모델에 많은 용도가 제안되어 왔다. 그것들을 흐릿한 JPEG라고 생각하는 것은 그들이 어디에 적합할지 또는 적합하지 않을지를 평가할 수 있는 방법을 제공한다. 몇 가지 시나리오를 생각해 보자.

대형 언어 모델이 기존의 검색 엔진을 대체할 수 있을까? 우리가 그것을 신뢰하기 위해서는 그것이 선전이나 음모론을 제공받지 않았다는 것을 알아야 한다. 그러나 대형 언어 모델이 우리가 원하는 정보만을 포함한다고 해도 여전히 불분명한 문제가 있다. 정보를 다른 단어로 다시 기술하는 것이다. 그리고 노골적인 조작의 애매함이 있는데, 사실을 찾을 때는 용납할 수 없다. 기술적으로 허용 가능한 종류의 흐릿함을 유지하면서 허용할 수 없는 종류의 흐릿함을 제거하는 것이 가능한지는 확실하지 않지만, 가까운 장래에 알게 될 것이다.

대형 언어 모델이 조작에 관여하는 것을 제한할 수 있다고 해도, 우리는 그것을 웹 컨텐츠 생성에 사용해야 하는가? 이는 웹에서 이미 사용 가능한 정보를 재패키지화하는 것이 우리의 목표인 경우에만 의미가 있다. 이러한 목적을 달성하기 위해 존재하는 기업도 있다.통상, 컨텐츠 공장이라고 부른다. 아마도 대형 언어 모델의 흐릿함은 저작권 침해를 피하기 위한 방법으로 그들에게 유용할 것이다. 그러나 재패키지의 증가는 우리가 온라인에서 찾고자 하는 것을 찾는 것을 어렵게 만든다.대형 언어 모델에 의해 생성된 텍스트가 웹에 공개될수록 웹은 더 흐릿한 버전이 된다.

OpenAI가 곧 출시할 OpenAI to Chat GPT, GPT-4에 대한 정보는 거의 없다. 그러나 예측해보면, GPT-4를 훈련하는데 사용되는 방대한 양의 텍스트를 조립할 때, ChatGPT나 다른 모델에 의해 생성된 자료를 제외하도록 만들 것이다. JPEG를 반복적으로 다시 저장하면 매번 더 많은 정보가 손실되므로 더 많은 압축 아티팩트가 생성되고, 그것은 옛날 복사물을 반복적으로 복사하는 디지털과 맞먹는다. 화질이 나빠질 뿐이다.

실제로, 대형 언어 모델의 품질을 측정하기 위한 유용한 기준은 기업이 생성한 텍스트를 새로운 모델의 교육 자료로 사용할 수 있는지 이다. 기존 모델이 새 모델을 교육하는 데 사용할 수 있을 정도로 우수한 텍스트를 생성하기 시작하면 해당 텍스트의 품질에 대한 확신이 생긴다. (이러한 결과를 얻으려면 이러한 모델을 구축하는 데 사용되는 기술에 큰 돌파구가 필요할 것이다.) 입력값만큼 우수한 출력을 생성하는 모델이 발견되면 손실 압축은 더 이상 적용되지 않는다.

대형 언어 모델이 독창적인 문자의 창조에 도움을 줄 수 있을까? 그 질문에 답하기 위해서는 그 질문이 무엇을 의미하는지 구체적으로 설명해야 한다. 제록스 아트, 즉 복사 예술로 알려진 예술 장르가 있는데, 예술가들은 복사기의 독특한 특성을 창의적인 도구로 사용한다. ChatGPT라는 복사기로도 분명 그러한 것들이 가능하다. 하지만 복사기가 예술의 창조에 필수적인 도구가 되었다고 주장할 사람은 아무도 없다. 대부분의 예술가들은 복사기를 그들의 창작 과정에 사용하지 않고 아무도 그들이 그 선택으로 인해 자신들을 불리하게 만들고 있다고 주장하지 않는다.

제록스 예술과 유사한 새로운 장르의 글을 말하는 것이 아니라고 가정한다면, 대형 언어 모델에 의해 만들어진 텍스트가 소설이든 논픽션이든 독창적인 것을 쓸 때 작가들에게 유용한 출발점이 될 수 있을까?

분명, 어느 누구도 모든 작가를 대변할 수는 없지만, 독창적이지 않은 작품의 흐릿한 카피로부터 시작하는 것은 독창적인 작품을 창조하는 좋은 방법이 아니다. 작가라면 독창적인 것을 쓰기 전에 독창적이지 않은 작품을 많이 쓸 것이다. 그리고 그 독창적이지 않은 작품에 들인 시간과 노력은 낭비가 아니다. 오히려, 그것이 결국 독창적인 것을 창조할 수 있게 하는 정확한 이유이다. 올바른 단어를 선택하고 서로 더 잘 따라하기 위해 문장을 재배치하는 데 소비하는 시간이 산문으로 의미가 전달되는 방법을 가르쳐 준다. 학생들이 에세이를 쓰도록 하는 것은 단지 그들이 그 자료를 이해하는지 시험하는 방법이 아니다. 그것은 학생들에게 그들의 생각을 표현하는 경험을 준다. 만약 학생들이 우리 모두가 이전에 읽은 적이 없는 에세이를 쓸 필요가 없다면, 그들은 결코 우리가 읽지 않은 것을 쓰는 데 필요한 기술을 얻지 못할 것이다.

졸업후에도 대형 언어 모델이 제공하는 템플릿을 안전하게 사용할 수 있는 것은 아니다. 졸업 후 자신의 생각을 표현하기 위한 노력은 사라지지 않는다. 새로운 작품의 초안을 작성하기 시작할 때마다 필요하다. 가끔은 글을 쓰는 과정에서만 독창적인 생각을 발견할 수 있다. 대형 언어 모델의 출력은 인간 작가의 초안과 크게 다르지 않다고 말할 수도 있다. 당신의 초안은 명확하게 표현된 독창적인 아이디어가 아니다. 그것은 제대로 표현되지 않은 독창적인 아이디어이다.

글쓰기에 마법이나 신비로운 것은 없지만, 신뢰할 수 없는 복사기에 기존 문서를 놓고 인쇄 버튼을 누르는 것 이상이다. 앞으로 AI를 만들 수 있을 것 같고, 그것은 세상 경험을 바탕으로 좋은 산문을 쓸 수 있다. 우리가 그것을 달성하는 날은 정말 중요한 날이 될 것이다. 하지만 그 날은 우리의 예측 범위를 훨씬 벗어난다. 인터넷에 대한 액세스가 영원히 끊기고 공간이 제한된 개인 서버에 복사본을 저장해야 한다면, Chat GPT와 같은 대형 언어 모델이 적합할 수 있다. 하지만 우리는 인터넷에 접속할 수 있는 기회를 잃지 않고 있다. 원본이 남아있을 때 흐릿한 JPEG는 얼마나 쓸까?

Coin Marketplace

STEEM 0.19
TRX 0.13
JST 0.030
BTC 60793.30
ETH 3356.37
USDT 1.00
SBD 2.48