갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
FC 온라인 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
0/0
타 갤러리 FC 온라인 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 성심당 딸기시루에서 곰팡이 딸기 나왔다고 뉴스 제보한 사람 ㅇㅇ
- 싱글벙글 헤어진 딸을 위로해주는 아버지 이진호
- 심각심각 skt 유심 상황 ㅇㅇ
- 꺼져! 꼴페미들아…미아역 추모 공간서 남성이 추모글 찢고 난동 감돌
- 현 일본 Z세대 대표 여배우 3인 ㅇㅇ
- 나거한)아이 안낳으면 감옥가야 발언 경찰조사....jpg ㅇㅇ
- 싱글벙글 중갤 레전드 인감과 맞바꾼 쌀과 김치 코드치기귀찮아
- 도전) 모찌 뽀삐털 만드는글 楽園
- 한 “조국 수호는 왜?” 홍 “법에도 눈물 있다“ 세티르
- 본인쟝 보약축제 옆에서 일하는 만화 코로론바
- 한녀와 뚜렷하게 다른 일녀 주갤러
- 내 인생 첫 여행지는 하코다테였음 ㅇㅇ
- 밀양 성폭행 사건 자매, 명예훼손 등의 혐의로 입건 ㅇㅇ
- 블라) 결혼시에 모든 재산을 오픈 해야할까요? 관심종자
- [망한머리 구조대 미용실형] 물에 삶은 유희왕 미용실형
플라자 합의와 일본 버블붕괴에 대해 알아보자...1편
1970~1980년대 일본의 워크맨, 자동차는 미국에서 불티나게 팔렸고 이로 인해 미국의 자동차 제조업을 맡던 디트로이트는 크게 쇠퇴함 미국 내에서 반일감정은 크게 솟구쳤고 (자기들이 좋다고 일제 마구 사대서 그리된거 아닌가...?) 아무튼 미국은 안보를 무기로 협박해서 플라자 합의를 이끌어냄 플라자 합의 직전 엔/달러는 240 정도였으나 합의 이후 계속 떨어져 버블 말기쯤엔 120까지 떨어짐 당연히 엔화 가치가 폭등하니 수출경쟁력이 떨어져 수출이 막히고 일본은 몰락의 길을 걷게됨 버블붕괴편은 다음에 계속 - 역사교양) 훌쩍훌쩍 일본의 플라자 합의와 버블붕괴...2편 1. 플라자 합의로 인해 엔화가치가 떡상하자 수출이 전멸했고, 일본정부는 그 해결방안으로 시장에 유동성을 공급해 내수를 키우겠다는 결정을 하여 막대한 양의 돈을 시중에 풀어버림 이게 버블의 시초 2. 일본 정부는 풀린 유동성이 내수발전으로 가길 기대했으나, 정작 자본은 모조리 부동산으로 쏠림 3. '에도의 땅값은 영원히 오른다'는 믿음 하에 사람들은 은행에서 대출을 풀로 땡겨서 부동산을 매수함 4. 땅값이 천정부지로 솟아 일반 서민들은 도심의 토끼장 같은 집조차도 구하지 못하게 됨 5. 이로 인해 주거 문제가 심해져 서민들의 불만이 커짐 6. 정부는 부동산 시장이 너무 과열됐다고 판단하고 은행한테 더 이상 부동산 대출 그만 내주라고 함 7. 부동산 대출이 막히자 더이상 거품 잔뜩 낀 가격에 부동산 살 사람이 없게됨 8. 그전에 대출받아 부동산 산 사람들은 이자를 못버텨서 부동산을 매도하려 하지만, 아무도 사겠다는 사람이 없어 가격이 폭락하게 됨 9. 결국 빚 못갚고 줄줄이 파산+채무자 엔딩 10. 이후로 일본은 두번다시 버블기의 호황을 누리지 못하고 잃어버린 30년을 겪게됨
작성자 : ㅇㅇ고정닉
GPT 환각 방지 프롬프트, 정말 효과가 있을까?
일단 이 글을 적기 위해서 11,046원을 지출하였음.후원 좀 받을 수 없나..?ㅋㅋㅋ환각(Hallucination)이란?챗갤 유저들이라면 아주 흔히 접해봤을 용어일 것임.간단히 말하면,LLM이 존재하지 않는 거짓 정보를 그럴싸하게 생성하는 현상을 말함.예를 들어,그러니까 존나 당당하게 틀린 말을 한다는 것이 문제인 거지.주요 LLM 개발사들은 환각 현상을 줄이기 위해 상당한 심혈을 기울이고 있고,유저들도 나름대로 대응책을 공유하고 있음.여러 프롬프트 사이트들 보면,여러 유저들이 환각을 줄이는 프롬프트를 공유하는 모습을 볼 수 있음.그러나 이런 프롬프트들이 실효성이 있는지에는 의문이 있음.이번에는 챗갤에 게시되었던 여러 환각 방지 프롬프트들을 정량적으로 평가해볼꺼임.SimpleQASimpleQA는 LLM의 사실성(factuality)를 측정하기 위한 OpenAI 벤치마크임.얼마나 환각을 적게 생성하는지, 얼마나 정확하게 응답하는지 평가함.주요 모델들 simpleQA 벤치마크베이스 모델 중에는 GPT-4.5가 가장 높은 정확도를 보임. 즉 환각이 제일 낮다는 뜻.https://github.com/openai/simple-evals GitHub - openai/simple-evalsContribute to openai/simple-evals development by creating an account on GitHub.github.comOpenAI는 simpleQA 벤치마크 데이터셋을 공개하고 있음.해당 데이터셋을 사용하여 프롬프트 벤치마크를 진행해볼꺼임
실험 세팅벤치마크: OpenAI SimpleQA테스트케이스 갯수: 500개방식: 테스트 모델이 벤치마크 문제들을 풀어오면, 채점자 모델이 채점하는 방식으로 진행테스트 모델: ChatGPT-4o-latest (최신 ChatGPT 4o 모델)파라미터- Temperature: 0.7- max_tokens: 150- 그 외에는 default채점자 모델: GPT-4.1.mini파라미터- Temperature: 0.1- max_tokens: 10상술했듯, OpenAI SimpleQA 벤치마크를 사용하였고, 현재 ChatGPT에서 서비스되고 있는 4o의 API를 사용하여 테스트함.테스트케이스는 원래는 4332개인데 내가 그지라서 좀 줄였음.Node.js로 벤치마크 프로그램을 만들어서 진행하였음.프롬프트별 테스트 결과OpenAI 기본 프롬프트(You are a helpful assistent)아주 기본적인 시스템 프롬프트만 포함하고 있음.정확도 39.6%공식 벤치마크 정확도가 38.2%이므로 상당히 준수한 성능을 뽑아내었음.하나빛 환각 방지 프롬프트정확도 38.6%오히려 기본 프롬프트에 비해 정확도가 떨어짐.ㅇㅇ(221.150) 환각 방지 프롬프트정확도 38.3%마찬가지로, 기본 프롬프트에 비해 낮은 정확도를 보여주었음.(DLC)모노로그 환각 방지 프롬프트딱 봐도 예능용 프롬프트지만, 그래도 한 번 테스트해봄.정확도 0%그만 알아보자.결과 비교프롬프트 종류정확도비고OpenAI 기본 프롬프트39.6%공식 벤치마크(38.2%)보다 약간 높음하나빛 프롬프트38.6%효과 미미ㅇㅇ(221.150) 프롬프트38.3%오히려 떨어짐모노로그 프롬프트(예능용)0%결론적으로,커뮤니티에서 공유된 대부분의 ‘환각 방지 프롬프트’는 오히려 기본 프롬프트보다 정확도가 낮았음.이는 프롬프트만으로 환각 문제를 해결하는 데 한계가 있다는 점을 다시 한 번 보여줌.하지만 그렇다고 프롬프트 엔지니어링이 무의미하다는 건 아님.일부 논문 중에는 프롬프팅을 통해 정확도를 향상시킨 사례도 존재함(CoVE라던가)즉, 잘 설계된 프롬프트는 분명 효과가 있을 수 있음.문제는 지금 돌아다니는 대부분의 환각 방지 프롬프트가 그저 조악하다는 거임.좋은 모델을 사용하고, 비판적으로 검토하는 것이 가장 나을 것임.
작성자 : 구름냥이고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.