갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
나는 솔로 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
추가한 갤러리가 없습니다.
0/0
타 갤러리 나는 솔로 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- "327억 얼른 찾아가세요" 3년 지나면 '나라가 꿀꺽'...jpg 빌애크먼
- 4월 17일 시황 우졍잉
- 차도에 맥주병 던진 여자때문에 사망한 50대 남성 ㅇㅇ
- [스압] 안철수"기술패권 경쟁시대, 이과 출신 대통령 나와야" 간미래
- 펌) 똥싸고 ㄸㄸㅇ 해놓고 도망간 배달기사 ㅇㅇ
- 휴게소 곰탕, 솥도 안 씻고 끓였다…위생불량 영업정지 식품공장 납품 감돌
- 싱글벙글 요즘 씹덕물 주인공이 죄다 쿨찐인 이유.manhwa 트랄랄레로트랄
- (스압) 홀로 큐슈 뚜벅이 여행 13일차 사진 1 (구마모토) 공복
- 전세사기 당한 청년층 근황 부갤러
- 국힘 토론회 일정 ㅇㅇ
- 남사친한테 자취방을 빌려준다는 여친... 이거 맞아?? 진짜 맞아??? 갓럭키
- 러브샷 5단계에 허벅지 만지고 음담패설⋯조선대 MT '성희롱 논란' 감돌
- 싱글벙글 콩고의 맛을 알려주겠다 2 퓨벤
- (4)오키나와를 여행하는 핑프를 위한 안내서 평범씨
- 일본 미국 빨기 시작ㅋㅋ 코갤러
OpenAI, o3와 o4-mini 출시
OpenAI o3 및 o4-mini 공개: 전체 도구 접근성을 갖춘 역대 가장 스마트하고 유능한 모델오늘 OpenAI는 응답하기 전에 더 오래 생각하도록 훈련된 o-시리즈 모델의 최신 버전인 OpenAI o3와 o4-mini를 출시합니다. 이는 저희가 지금까지 출시한 모델 중 가장 스마트한 모델로, 호기심 많은 사용자부터 고급 연구원에 이르기까지 모든 사람을 위한 ChatGPT의 능력을 한 단계 끌어올렸습니다. 처음으로 저희 추론 모델이 ChatGPT 내의 모든 도구를 능동적으로 사용하고 결합할 수 있게 되었습니다. 여기에는 웹 검색, Python을 사용한 파일 및 기타 데이터 분석, 시각적 입력에 대한 깊이 있는 추론, 이미지 생성까지 포함됩니다. 결정적으로, 이 모델들은 더 복잡한 문제를 해결하기 위해 일반적으로 1분 이내에 올바른 출력 형식으로 상세하고 사려 깊은 답변을 생성하기 위해 언제, 어떻게 도구를 사용해야 하는지 추론하도록 훈련되었습니다. 이를 통해 다면적인 질문을 더 효과적으로 처리할 수 있으며, 사용자를 대신하여 독립적으로 작업을 수행할 수 있는 보다 능동적인 ChatGPT를 향한 한 걸음입니다. 최첨단 추론 능력과 전체 도구 접근성의 결합된 힘은 학문적 벤치마크와 실제 작업 모두에서 훨씬 더 강력한 성능으로 이어져 지능과 유용성 모두에서 새로운 기준을 세웁니다.변경된 점OpenAI o3는 코딩, 수학, 과학, 시각 인식 등 다양한 분야에서 최고 성능을 보여주는 가장 강력한 추론 모델입니다. Codeforces, SWE-bench(맞춤형 모델별 스캐폴드 구축 없이), MMMU 등 벤치마크에서 새로운 SOTA(최고 수준)를 기록했습니다. 다면적 분석이 필요하고 답이 즉시 명확하지 않을 수 있는 복잡한 쿼리에 이상적입니다. 특히 이미지, 차트, 그래픽 분석과 같은 시각적 작업에서 강력한 성능을 발휘합니다. 외부 전문가 평가에서 o3는 어려운 실제 작업에서 OpenAI o1보다 주요 오류를 20% 적게 발생시켰으며, 특히 프로그래밍, 비즈니스/컨설팅, 창의적 아이디어 구상과 같은 분야에서 뛰어났습니다. 초기 테스터들은 사고 파트너로서의 분석적 엄격함을 강조하고, 특히 생물학, 수학, 공학 분야 내에서 새로운 가설을 생성하고 비판적으로 평가하는 능력을 강조했습니다.OpenAI o4-mini는 빠르고 비용 효율적인 추론에 최적화된 소형 모델입니다. 크기와 비용 대비 놀라운 성능을 달성하며, 특히 수학, 코딩, 시각적 작업에서 뛰어납니다. AIME 2025에서 o4-mini는 Python 인터프리터 접근 권한이 주어졌을 때 99.5%의 점수를 기록하여 이 벤치마크를 사실상 포화시켰습니다. 전문가 평가에서도 STEM 외 작업뿐만 아니라 데이터 과학과 같은 영역에서도 이전 모델인 o3-mini보다 뛰어난 성능을 보였습니다. 효율성 덕분에 o4-mini는 o3보다 훨씬 높은 사용량 한도를 지원하므로, 추론이 필요한 질문에 대해 대용량, 고처리량 옵션으로 강력합니다.외부 전문가 평가자들은 두 모델 모두 향상된 지능과 웹 소스 포함 덕분에 이전 모델보다 향상된 지시 사항 준수 능력과 더 유용하고 검증 가능한 응답을 보여준다고 평가했습니다. 이전 버전의 추론 모델과 비교할 때, 이 두 모델은 특히 기억과 과거 대화를 참조하여 응답을 더 개인화되고 관련성 있게 만들기 때문에 더 자연스럽고 대화적으로 느껴질 것입니다.강화 학습의 지속적인 확장OpenAI o3 개발 전반에 걸쳐, 대규모 강화 학습이 GPT 시리즈 사전 훈련에서 관찰된 것과 동일한 "더 많은 컴퓨팅 = 더 나은 성능" 추세를 보인다는 것을 관찰했습니다. 이 확장 경로를 RL에서 다시 추적함으로써 훈련 컴퓨팅과 추론 시간 추론 모두에서 추가적인 자릿수만큼 확장했지만, 여전히 명확한 성능 향상을 확인하여 모델이 더 많이 생각하도록 허용할수록 성능이 계속 향상된다는 것을 입증했습니다. OpenAI o1과 동일한 지연 시간 및 비용으로 o3는 ChatGPT에서 더 높은 성능을 제공하며, 더 오래 생각하게 하면 성능이 계속 상승한다는 것을 검증했습니다.또한 강화 학습을 통해 두 모델 모두 도구를 사용하도록 훈련했습니다. 즉, 도구를 사용하는 방법뿐만 아니라 언제 사용해야 하는지 추론하도록 가르쳤습니다. 원하는 결과에 따라 도구를 배포하는 능력은 개방형 상황, 특히 시각적 추론 및 다단계 워크플로우를 포함하는 상황에서 모델을 더욱 유능하게 만듭니다. 이러한 개선은 초기 테스터들이 보고한 바와 같이 학문적 벤치마크와 실제 작업 모두에 반영됩니다.이미지로 생각하기처음으로 이 모델들은 이미지를 사고 과정에 직접 통합할 수 있습니다. 단순히 이미지를 보는 것이 아니라, 이미지로 생각합니다. 이는 시각적 및 텍스트적 추론을 혼합하는 새로운 종류의 문제 해결을 가능하게 하며, 멀티모달 벤치마크 전반에 걸친 최첨단 성능에 반영됩니다.사용자는 화이트보드 사진, 교과서 다이어그램 또는 손으로 그린 스케치를 업로드할 수 있으며, 이미지가 흐리거나, 뒤집히거나, 저화질이라도 모델은 이를 해석할 수 있습니다. 도구 사용을 통해 모델은 추론 과정의 일부로 즉석에서 이미지를 회전, 확대/축소 또는 변환하여 조작할 수 있습니다.이 모델들은 시각 인식 작업에서 동급 최고의 정확도를 제공하여 이전에는 해결할 수 없었던 질문을 해결할 수 있게 합니다. 자세한 내용은 시각적 추론 연구 블로그를 확인하세요.능동적인 도구 사용을 향하여OpenAI o3 및 o4-mini는 ChatGPT 내의 도구뿐만 아니라 API의 함수 호출을 통해 사용자 지정 도구에도 완전히 접근할 수 있습니다. 이 모델들은 문제를 해결하는 방법을 추론하도록 훈련되었으며, 일반적으로 1분 이내에 올바른 출력 형식으로 상세하고 사려 깊은 답변을 신속하게 생성하기 위해 언제, 어떻게 도구를 사용해야 하는지 선택합니다.예를 들어, 사용자는 "캘리포니아의 여름 에너지 사용량은 작년과 비교하여 어떻게 될까요?"라고 질문할 수 있습니다. 모델은 공공 유틸리티 데이터를 웹에서 검색하고, 예측을 구축하기 위한 Python 코드를 작성하고, 그래프나 이미지를 생성하고, 예측의 주요 요인을 설명하며 여러 도구 호출을 연결할 수 있습니다. 추론을 통해 모델은 마주치는 정보에 따라 필요에 맞게 반응하고 방향을 전환할 수 있습니다. 예를 들어, 검색 제공 업체의 도움을 받아 웹을 여러 번 검색하고, 결과를 보고, 더 많은 정보가 필요하면 새로운 검색을 시도할 수 있습니다.이러한 유연하고 전략적인 접근 방식을 통해 모델은 모델의 내장된 지식을 넘어서는 최신 정보 접근, 확장된 추론, 합성 및 여러 양식에 걸친 출력 생성이 필요한 작업을 처리할 수 있습니다.모든 예시는 OpenAI o3로 완료되었습니다.비용 효율적인 추론 발전OpenAI o3 및 o4-mini는 저희가 출시한 모델 중 가장 지능적이며, 이전 모델인 OpenAI o1 및 o3-mini보다 종종 더 효율적입니다. 예를 들어, 2025 AIME 수학 경진대회에서 o3의 비용-성능 경계는 o1을 명백히 개선하며, 유사하게 o4-mini의 경계는 o3-mini를 명백히 개선합니다. 더 일반적으로, 대부분의 실제 사용 사례에서 o3 및 o4-mini는 각각 o1 및 o3-mini보다 더 스마트하고 저렴할 것으로 예상합니다.안전성모델 기능이 향상될 때마다 그에 상응하는 안전성 개선이 필요합니다. OpenAI o3 및 o4-mini의 경우, 생물학적 위협(바이오리스크), 멀웨어 생성, 탈옥과 같은 영역에서 새로운 거부 프롬프트를 추가하여 안전성 훈련 데이터를 완전히 재구축했습니다. 이 새로워진 데이터 덕분에 o3 및 o4-mini는 내부 거부 벤치마크(예: 지시 계층 구조, 탈옥)에서 강력한 성능을 달성했습니다. 모델 거부에 대한 강력한 성능 외에도, 프론티어 위험 영역에서 위험한 프롬프트를 탐지하기 위한 시스템 수준의 완화 조치도 개발했습니다. 이전의 이미지 생성 작업과 유사하게, 사람이 작성하고 해석 가능한 안전 사양에 따라 작동하는 추론 LLM 모니터를 훈련했습니다. 바이오리스크에 적용했을 때, 이 모니터는 인간 레드팀 캠페인의 대화 중 약 99%를 성공적으로 탐지했습니다.저희는 역대 가장 엄격한 안전 프로그램을 통해 두 모델을 스트레스 테스트했습니다. 업데이트된 준비 태세 프레임워크에 따라, 프레임워크가 다루는 세 가지 추적 기능 영역인 생물학적 및 화학적, 사이버 보안, AI 자기 개선 전반에 걸쳐 o3 및 o4-mini를 평가했습니다. 이러한 평가 결과에 기초하여, o3 및 o4-mini 모두 세 범주 모두에서 프레임워크의 "높음" 임계값 미만으로 유지된다고 판단했습니다. 이러한 평가의 상세 결과는 첨부된 시스템 카드에 게시했습니다.Codex CLI: 터미널에서의 프론티어 추론또한 새로운 실험인 Codex CLI를 공유합니다. 이는 터미널에서 실행할 수 있는 경량 코딩 에이전트입니다. 컴퓨터에서 직접 작동하며, o3 및 o4-mini와 같은 모델의 추론 능력을 극대화하도록 설계되었으며, GPT-4.1과 같은 추가 API 모델에 대한 지원이 곧 제공될 예정입니다.스크린샷이나 저해상도 스케치를 모델에 전달하고 로컬 코드에 접근하여 명령줄에서 멀티모달 추론의 이점을 얻을 수 있습니다. 저희는 이를 모델과 사용자 및 컴퓨터를 연결하는 최소한의 인터페이스로 생각합니다. Codex CLI는 오늘 github.com/openai/codex(새 창에서 열림)에서 완전한 오픈 소스로 제공됩니다.이와 함께 Codex CLI 및 OpenAI 모델을 사용하는 프로젝트를 지원하기 위해 1백만 달러 규모의 이니셔티브를 시작합니다. API 크레딧 형태로 25,000달러 단위의 보조금 신청서를 평가하고 수락할 것입니다. 제안서는 여기에서 제출할 수 있습니다.접근성ChatGPT Plus, Pro, Team 사용자는 오늘부터 모델 선택기에서 o1, o3-mini, o3-mini-high를 대체하는 o3, o4-mini, o4-mini-high를 볼 수 있습니다. ChatGPT Enterprise 및 Edu 사용자는 일주일 후에 접근 권한을 얻게 됩니다. 무료 사용자는 쿼리를 제출하기 전에 작성기에서 '생각하기(Think)'를 선택하여 o4-mini를 사용해 볼 수 있습니다. 모든 플랜의 속도 제한은 이전 모델 세트에서 변경되지 않았습니다.몇 주 내에 전체 도구 지원을 갖춘 OpenAI o3-pro를 출시할 것으로 예상합니다. 현재 Pro 사용자는 여전히 o1-pro에 접근할 수 있습니다.o3 및 o4-mini는 오늘부터 Chat Completions API 및 Responses API를 통해 개발자에게도 제공됩니다(일부 개발자는 이러한 모델에 접근하기 위해 조직을 확인(새 창에서 열림)해야 할 수 있습니다). Responses API는 추론 요약, 더 나은 성능을 위해 함수 호출 주변의 추론 토큰을 보존하는 기능 등을 지원하며, 곧 모델의 추론 내에서 웹 검색, 파일 검색, 코드 인터프리터와 같은 내장 도구를 지원할 예정입니다. 시작하려면 저희 문서(새 창에서 열림)를 살펴보고 더 많은 업데이트를 기대해 주세요.다음 단계오늘의 업데이트는 저희 모델이 나아갈 방향을 반영합니다: o-시리즈의 특화된 추론 능력과 GPT-시리즈의 보다 자연스러운 대화 능력 및 도구 사용을 융합하고 있습니다. 이러한 강점을 통합함으로써 미래의 모델은 선제적인 도구 사용 및 고급 문제 해결과 함께 원활하고 자연스러운 대화를 지원할 것입니다.- (오픈AI) o3 및 o4-mini 공개2025년 4월 16일 | 출시 | 제품OpenAI o3 및 o4-mini 공개: 역대 가장 스마트하고 유능하며 완전한 도구 접근성을 갖춘 모델[ChatGPT에서 사용해 보기]오늘, OpenAI는 o-시리즈의 최신 모델인 o3와 o4-mini를 출시합니다. 이 모델들은 응답하기 전에 더 깊이 사고하도록 훈련되었습니다. 현재까지 저희가 출시한 모델 중 가장 스마트하며, 호기심 많은 사용자부터 고급 연구원에 이르기까지 모든 이들에게 ChatGPT 역량의 획기적인 발전(step change)을 보여줍니다. 처음으로 저희 추론 모델들은 스스로 판단하여(agentically) ChatGPT 내의 모든 도구 – 웹 검색, Python을 이용한 파일 및 데이터 분석, 시각적 입력에 대한 심층 추론, 이미지 생성까지 – 를 활용하고 조합할 수 있습니다. 결정적으로, 이 모델들은 언제 어떻게 도구를 사용해야 할지 추론하여, 일반적으로 1분 이내에 정확한 출력 형식으로 상세하고 심도 있는 답변을 생성함으로써 더 복잡한 문제를 해결하도록 훈련되었습니다. 이를 통해 다면적인 질문을 더욱 효과적으로 처리할 수 있으며, 사용자를 대신하여 독립적으로 작업을 수행할 수 있는 더욱 주체적인(agentic) ChatGPT로 나아가는 한 걸음입니다. 최첨단 추론 능력과 완전한 도구 접근성의 결합은 학술 벤치마크와 실제 과제 전반에서 현저하게 향상된 성능으로 이어져, 지능과 유용성 모두에서 새로운 기준을 제시합니다.무엇이 달라졌는가OpenAI o3는 코딩, 수학, 과학, 시각 인식 등 전 분야에 걸쳐 기술의 한계를 넓히는 저희의 가장 강력한 추론 모델입니다. Codeforces, SWE-bench(맞춤형 모델별 스캐폴드 구축 없이), MMMU 등 벤치마크에서 새로운 최고 성능(SOTA)을 기록했습니다. 다면적 분석이 필요하고 답이 즉각적으로 명확하지 않은 복잡한 질의에 이상적입니다. 특히 이미지, 차트, 그래픽 분석과 같은 시각적 작업에서 강력한 성능을 보입니다. 외부 전문가 평가에서 o3는 어려운 실제 과제에서 OpenAI o1보다 주요 오류를 20% 적게 발생시켰으며, 특히 프로그래밍, 비즈니스/컨설팅, 창의적 아이디어 구상 분야에서 뛰어난 성과를 보였습니다. 초기 테스터들은 사고 파트너로서의 분석적 엄밀함을 높이 평가했으며, 특히 생물학, 수학, 공학 분야에서 새로운 가설을 생성하고 비판적으로 평가하는 능력을 강조했습니다.OpenAI o4-mini는 빠르고 비용 효율적인 추론에 최적화된 소형 모델입니다. 크기와 비용 대비 놀라운 성능을 달성하며, 특히 수학, 코딩, 시각적 작업에서 뛰어납니다. AIME 2024 및 2025에서 새로운 최고 성능(SOTA)을 기록했습니다. 전문가 평가에서는 데이터 과학과 같은 영역뿐만 아니라 비 STEM 분야에서도 이전 모델인 o3-mini를 능가했습니다. 효율성 덕분에 o4-mini는 o3보다 훨씬 높은 사용 한도를 지원하므로, 추론 능력이 중요한 대량, 고처리량 질문에 강력한 옵션입니다.외부 전문가 평가자들은 두 모델 모두 향상된 지능과 웹 소스 포함 덕분에 이전 모델들보다 개선된 지시 사항 준수 능력과 더 유용하고 검증 가능한 응답을 보여준다고 평가했습니다. 이전 버전의 추론 모델들과 비교하여, 이 두 모델은 특히 기억과 과거 대화를 참조하여 응답을 더욱 개인화되고 관련성 높게 만들기 때문에 더 자연스럽고 대화적인 느낌을 줄 것입니다.모든 모델은 ChatGPT의 'o4-mini-high'와 유사한 높은 '추론 노력(reasoning effort)' 설정에서 평가되었습니다.강화 학습의 지속적인 확장OpenAI o3 개발 전반에 걸쳐, 저희는 대규모 강화 학습이 GPT 시리즈 사전 훈련에서 관찰된 것과 동일한 "더 많은 컴퓨팅 = 더 나은 성능" 추세를 보인다는 것을 관찰했습니다. 이번에는 강화 학습에서 스케일링 경로를 되짚어봄으로써, 훈련 컴퓨팅과 추론 시간 추론 모두에서 추가적인 자릿수(order of magnitude)만큼 확장했음에도 여전히 명확한 성능 향상을 확인했습니다. 이는 모델이 더 많이 생각하도록 허용할수록 성능이 계속 향상된다는 것을 입증합니다. OpenAI o1과 동일한 지연 시간 및 비용에서 o3는 ChatGPT에서 더 높은 성능을 제공하며, 더 오래 생각하게 하면 성능이 계속 상승한다는 것을 검증했습니다.또한 저희는 강화 학습을 통해 두 모델이 도구를 사용하도록 훈련했습니다. 단순히 도구 사용법뿐만 아니라 언제 사용해야 할지 추론하는 능력을 가르쳤습니다. 원하는 결과에 따라 도구를 배치하는 능력은 특히 시각적 추론과 다단계 워크플로우를 포함하는 개방형 상황에서 모델을 더욱 유능하게 만듭니다. 이러한 개선은 초기 테스터들이 보고한 바와 같이 학술 벤치마크와 실제 과제 모두에 반영되었습니다.이미지와 함께 사고하기처음으로 이 모델들은 이미지를 자신의 사고 과정(chain of thought)에 직접 통합할 수 있습니다. 단순히 이미지를 보는 것을 넘어, 이미지를 가지고 생각합니다. 이는 시각적 및 텍스트적 추론을 결합하는 새로운 종류의 문제 해결을 가능하게 하며, 다중 모드 벤치마크 전반에서 최첨단 성능으로 나타납니다.사용자는 화이트보드 사진, 교과서 다이어그램 또는 손으로 그린 스케치를 업로드할 수 있으며, 이미지가 흐릿하거나, 뒤집혀 있거나, 저품질이더라도 모델은 이를 해석할 수 있습니다. 도구 사용을 통해 모델은 추론 과정의 일부로 이미지를 즉석에서 회전, 확대/축소 또는 변형하는 등 조작할 수 있습니다.이 모델들은 시각 인식 작업에서 동급 최고의 정확도를 제공하여 이전에는 해결할 수 없었던 질문을 풀 수 있게 합니다. 자세한 내용은 시각적 추론 연구 블로그를 확인하세요.주체적인 도구 사용을 향하여OpenAI o3 및 o4-mini는 ChatGPT 내의 도구뿐만 아니라 API의 함수 호출(function calling)을 통해 사용자의 자체 맞춤형 도구에도 완전한 접근 권한을 갖습니다. 이 모델들은 문제를 해결하는 방법을 추론하고, 언제 어떻게 도구를 사용하여 일반적으로 1분 이내에 정확한 출력 형식으로 상세하고 심도 있는 답변을 신속하게 생성할지 선택하도록 훈련되었습니다.예를 들어, 사용자가 "캘리포니아의 여름철 에너지 사용량이 작년과 비교하여 어떻게 될까요?"라고 질문할 수 있습니다. 모델은 공공 유틸리티 데이터를 웹에서 검색하고, 예측 모델을 구축하기 위해 Python 코드를 작성하고, 그래프나 이미지를 생성하고, 예측의 주요 요인을 설명하는 등 여러 도구 호출을 연쇄적으로 수행할 수 있습니다. 추론 능력 덕분에 모델은 마주치는 정보에 따라 필요에 맞게 반응하고 방향을 전환할 수 있습니다. 예를 들어, 검색 제공자의 도움을 받아 웹을 여러 번 검색하고, 결과를 살펴보고, 더 많은 정보가 필요하면 새로운 검색을 시도할 수 있습니다.이러한 유연하고 전략적인 접근 방식을 통해 모델은 내장된 지식을 넘어서는 최신 정보 접근, 확장된 추론, 종합, 그리고 여러 양식에 걸친 출력 생성이 필요한 작업을 처리할 수 있습니다.모든 예시는 OpenAI o3로 완료되었습니다.링크OpenAI o3는 검색을 사용하지 않고도 정확한 응답을 얻는 반면, o1은 정확한 응답을 제공하지 못합니다.비용 효율적인 추론의 발전비용 대비 성능: o3-mini 및 o4-mini비용 대비 성능: o1 및 o3OpenAI o3 및 o4-mini는 저희가 출시한 가장 지능적인 모델이며, 이전 모델인 OpenAI o1 및 o3-mini보다 종종 더 효율적입니다. 예를 들어, 2025년 AIME 수학 경시대회에서 o3의 비용-성능 경계선은 o1보다 확실히 개선되었으며, 마찬가지로 o4-mini의 경계선도 o3-mini보다 확실히 개선되었습니다. 더 일반적으로, 대부분의 실제 사용 사례에서 o3와 o4-mini는 각각 o1과 o3-mini보다 더 스마트하고 저렴할 것으로 예상합니다.안전성모델 능력의 모든 개선에는 그에 상응하는 안전성 개선이 필요합니다. OpenAI o3 및 o4-mini를 위해 저희는 안전 훈련 데이터를 완전히 재구축하여 생물학적 위협(바이오리스크), 악성 코드 생성, 탈옥(jailbreaks)과 같은 영역에서 새로운 거부 프롬프트를 추가했습니다. 이 새로워진 데이터 덕분에 o3와 o4-mini는 내부 거부 벤치마크(예: 지시 계층 구조, 탈옥)에서 강력한 성능을 달성했습니다. 모델 거부에 대한 강력한 성능 외에도, 저희는 최전선 위험 영역에서 위험한 프롬프트를 탐지하기 위한 시스템 수준의 완화 조치도 개발했습니다. 이미지 생성에서의 이전 작업과 유사하게, 인간이 작성하고 해석 가능한 안전 사양에 따라 작동하는 추론 LLM 모니터를 훈련했습니다. 바이오리스크에 적용했을 때, 이 모니터는 인간 레드팀 캠페인에서 대화의 약 99%를 성공적으로 탐지했습니다.저희는 현재까지 가장 엄격한 안전 프로그램을 통해 두 모델을 스트레스 테스트했습니다. 업데이트된 준비 상태 프레임워크에 따라, 저희는 프레임워크에서 다루는 추적된 세 가지 능력 영역인 생물학 및 화학, 사이버 보안, AI 자가 개선에 걸쳐 o3와 o4-mini를 평가했습니다. 이러한 평가 결과에 기초하여, 저희는 o3와 o4-mini 모두 세 가지 범주 모두에서 프레임워크의 "높음(High)" 임계값 미만으로 유지된다고 판단했습니다. 이러한 평가의 자세한 결과는 첨부된 시스템 카드에서 발표했습니다.Codex CLI: 터미널에서의 최첨단 추론저희는 또한 새로운 실험인 Codex CLI를 공유합니다. 이는 터미널에서 실행할 수 있는 경량 코딩 에이전트입니다. 사용자의 컴퓨터에서 직접 작동하며 o3 및 o4-mini와 같은 모델의 추론 능력을 극대화하도록 설계되었으며, 곧 GPT-4.1과 같은 추가 API 모델도 지원할 예정입니다.스크린샷이나 간단한 스케치를 모델에 전달하고 로컬 코드에 접근하여 명령줄에서 다중 모드 추론의 이점을 얻을 수 있습니다. 저희는 이를 모델과 사용자 및 사용자 컴퓨터를 연결하는 최소한의 인터페이스로 생각합니다. Codex CLI는 오늘 github.com/openai/codex에서 완전히 오픈 소스로 공개됩니다.이와 함께, 저희는 Codex CLI 및 OpenAI 모델을 사용하는 프로젝트를 지원하기 위해 1백만 달러 규모의 이니셔티브를 시작합니다. 미화 25,000달러 단위의 API 크레딧 형태로 보조금 신청서를 평가하고 수락할 것입니다. 제안서는 여기에서 제출할 수 있습니다.이용 안내ChatGPT Plus, Pro, Team 사용자는 오늘부터 모델 선택기에서 o1, o3-mini, o3-mini-high를 대체하는 o3, o4-mini, o4-mini-high를 볼 수 있습니다. ChatGPT Enterprise 및 Edu 사용자는 일주일 후에 이용할 수 있습니다. 무료 사용자는 쿼리를 제출하기 전에 작성기에서 '생각하기(Think)'를 선택하여 o4-mini를 사용해 볼 수 있습니다. 모든 요금제의 속도 제한은 이전 모델 세트와 동일하게 유지됩니다.몇 주 안에 완전한 도구 지원을 갖춘 OpenAI o3-pro를 출시할 것으로 예상합니다. 현재 Pro 사용자는 여전히 o1-pro에 접근할 수 있습니다.o3와 o4-mini 모두 오늘부터 Chat Completions API 및 Responses API를 통해 개발자에게도 제공됩니다(일부 개발자는 이러한 모델에 접근하기 위해 조직 인증이 필요할 수 있습니다). Responses API는 추론 요약, 더 나은 성능을 위해 함수 호출 주변의 추론 토큰을 보존하는 기능 등을 지원하며, 곧 모델의 추론 내에서 웹 검색, 파일 검색, 코드 인터프리터와 같은 내장 도구를 지원할 예정입니다. 시작하려면 저희 문서를 살펴보고 추가 업데이트를 기다려 주십시오.다음 단계오늘의 업데이트는 저희 모델이 나아갈 방향을 반영합니다: 저희는 o-시리즈의 전문화된 추론 능력과 GPT-시리즈의 보다 자연스러운 대화 능력 및 도구 사용을 융합하고 있습니다. 이러한 강점을 통합함으로써, 저희의 미래 모델은 선제적인 도구 사용 및 고급 문제 해결과 함께 원활하고 자연스러운 대화를 지원할 것입니다.원문 링크- o3 사용 후기 (vs 2.5 pro)OAI에 좀 편향되게 평가하는 아저씨긴한데 그래도 참고하삼biomedical scientist임- o3 문제퓰이 개지리는데??? (vs 2.5 pro) 위 문제 이미지로 넣고 풀게 시킴 O3 원큐에 정답 2.5 pro: 밑에 잘렸는데 답 9 라고함 = ㅂㅅ 추가로 o1 pro, o3 mini, grok3 다 못풀었었음 옛날에 이미 다 시켜봄 - dc official App- 속보) 애니프사의 o3 / o4mh 사용후기...jpg- 속보) o3 시간맞추기 최초성공지금까지 시계보고 시간맞추는 모델은 없었는데 o3가 최초 통과함. o4미니는 실패 - dc official App
작성자 : sama고정닉
현재 미국에서 논란중인 케이티 페리
- 케이티 페리 우주여행https://youtu.be/74Y5FM8EWnc?si=gspWhlaId6yCoJNy [이 시각 세계] 팝스타 케이티 페리, 10분간 우주여행 (2025.04.15/뉴스투데이/MBC)아마존 창업자 제프 베이조스가 설립한 우주기업 블루 오리진이, 팝스타 케이티 페리와 베이조스의 약혼녀 등을 태운 우주선 비행을 성공적으로 마쳤습니다.https://imnews.imbc.com/replay/2025/nwtoday/article/6706422_36807.html#케이티...youtu.be비행시간 총 10분 무중력 체험시간 4분 블루오리진 해치는 외부에서 열어야 함 열어주러가는데 열림ㅋㅋㅋ 딥페이크 AI 영상확률 82% ㅋㅋ - 팝스타 케이티페리 우주여행 가짜로 의심받고있다1. 탐사선에 대기권 재진입시 발생되는 열에의한 외부 그을림이 전혀없음 2. 탐사선은 내부에서 해치를 개방할수 없게되어있는데 착륙후 엔지니어가 다가가기도 전에 내부에서 문이 먼져열렸다는것미국내에서는 상당한 의심을 받고잇음 - 피폭이 페창 우주여행에 대해 얘기한거 전문번역해옴어제 오전 9시 31분(미 동부 표준시), 완벽한 헤어와 메이크업, 디자이너가 제작한 코발트 블루 보디슈트를 갖춰 입은 케이티 페리는 역사적인 순간을 맞이할 준비를 끝냈다. 우주 경계선까지의 왕복 11분 여정인 NS-31편 로켓에 탑승하며 그녀는 “우주비행사의 뒤태(ass)를 제대로 보여주겠다”고 선언했다. 아마도 이 단어들을 이 순서대로 말한 최초의 인물일 가능성이 매우 높다는 점에서, 그녀의 발언은 더더욱 멋지고 용감하다. 이 여정에 대해 잘 모르는 사람들을 위해 간단히 설명하자면: 이번 우주 여행에는 CBS 모닝스의 공동 진행자인 게일 킹, 저널리스트 로런 산체스, 항공우주 엔지니어 아이샤 보우, 활동가 아만다 응우옌, 영화 제작자 케리앤 플린이 케이티 페리와 동행했다. 이 미션은 제프 베이조스의 민간 우주 기업 블루 오리진이 후원한 것으로, 1963년 러시아의 우주비행사 발렌티나 테레시코바가 혼자서 지구 궤도를 돈 이후 처음으로 전원이 여성으로만 구성된 우주 비행이었다. 케이티 페리는 우주 여행을 수십 년 전부터 꿈꿔왔다고 하는데, 그녀는 점성술과 천문학, 천체물리학, 피타고라스의 이론 등에 오래전부터 큰 관심을 가져왔다(특별한 순서 없이 말이다). 그녀는 일반적인 우주비행사들이 하듯이 우주 비행 훈련 세션에 참여하고, 칼 세이건의 『코스모스』를 "들으면서" 우주여행을 준비했고, 끈 이론(string theory)에 관한 책을 읽다가 잠들곤 했다고 한다. 어제 로켓이 발사되는 순간, 생중계를 보던 시청자들은 『더 미러』지가 묘사한 대로 “미친 듯한 비명”을 듣게 되었다. 일부 팬들은 페리와 승무원들에게 큰 사고가 난 줄 알고 걱정하면서 생중계 댓글창을 기도와 응원으로 가득 채웠다. 그러나 아무 문제도 없었다. 사실, 문제없음 정도가 아니라 매우 성공적이었다. 우주비행 중 한순간, 승무원들은 카메라를 바라보며 당당하게 “공간을 차지해!(Take up space!)”라고 외쳤다. 이는 ‘얌전한 여성은 역사를 바꾸기 어렵다’는 중요한 교훈을 상기시켜주는 순간이었다. 착륙 직후 게일 킹은 케이티 페리가 약속대로 비행 중에 노래를 불렀다고 밝혔다. 페리 전문가인 나로서는 그녀가 당연히 외계인 연인에 대한 히트곡 「E.T.」(2011)를 부를 거라 예상했지만, 그녀는 역시나 놀라움의 연속이었다. 그녀는 자신의 노래가 아니라 「What a Wonderful World」를 선택했는데, 그 이유는 이 날을 오직 자신만의 날로 만들고 싶지 않았기 때문이다. 그녀의 표현을 빌리자면, 이번 여행은 “지구를 위한 것”이었다. 페리는 다른 사람들을 먼저 생각하겠다는 약속을 지키면서도, 이번 여정을 통해 개인적으로 많은 걸 얻은 듯하다. 그녀는 “이 경험을 강력히 추천한다”고 말했는데, 이는 우주여행과 ‘기내용 가방을 가져갈 수 없어서 옷을 13겹 껴입고 타야 하는 저가항공의 이코노미석’을 고민하고 있는 우리들에게 매우 유용한 정보다. 일부 사람들—흔히 말하는 ‘안티팬(haters)’이라고 할 수 있겠다—은 페리가 우주에서 지구의 아름다움을 목격한 뒤, 기후 위기로 인해 곧 사라질지도 모르는 이 풍경 앞에서 극심한 실존적 공포를 느끼게 될지도 모른다고 우려했다. 세계는 너무나 아름답고 덧없으며, 우리는 그 모든 것을 파괴하고 있고, 나는 그걸 두 눈으로 보고 있다—이 모든 걸 한 번에 받아들이기엔 너무 큰 자극일지도 모른다. 하지만 페리는 그런 안티팬들과 비관론자들의 예상을 깨뜨렸다. 그녀가 우주에서 깨달은 것은, 자신이 ‘신성한 여성성(divine feminine)’과 연결되어 있다는 점이었고, “얼마나 사랑받고 있는지는 실제로 날아오르는 그날이 되어야만 알 수 있다”는 사실이었다. 이번 우주여행이 사회 정의적 의미를 담고 있다는 것은 분명하다. 지난해 도발적인 페미니즘 찬가 「Woman’s World」에서 여성을 "섹시하고 당당하며, 지적이고, 하늘이 내려준 존재, 부드러우면서도 강인하다"고 묘사한 팝스타라면 당연히 예상할 수 있는 부분이다. 페리는 또한 이번 여정을 통해 자신의 네 살 딸 데이지에게 "배경이나 민족, 경제적 상황, 교육 수준에 상관없이 누구나 꿈을 이룰 수 있다는 사실"을 가르쳐 주고 싶었다고 밝혔다. 이 감동적인 메시지는 평소 공정성과 평등을 적극적으로 지지하는 크리스 제너와 클로이 카다시안에게도 깊은 공감을 얻었다. 현장에서 발사 장면을 직접 목격한 카다시안은 이렇게 말했다. “오늘날 세상에서는 무엇을 꿈꾸든 우리의 손이 닿는 곳에 있어요. 크게 꿈꾸고, 별을 향해 소원을 빌어 보세요. 그러다 보면 언젠가는 당신도 그 별들 사이에 있게 될지 몰라요.” 당신이 꿈꾸는 모든 것은 우리의 손이 닿는 곳에 있다—멋지다. 이 모든 일은 야망 있는 여성으로서의 나에게도 깊은 울림을 준다. 진심이 담긴 문장을 썼을 때나, 이전보다 빠르게 5km 달리기를 마친 날이면 늘 내 머릿속엔 한 가지 소원이 떠오르곤 했다. “지금 내가 예뻐 보인다면 완벽할 텐데.” 그리고 뒤이어 또 하나의 소원을 빌었다. “우주에도 화려함(glam)이 존재한다면 좋을 텐데.” 이제, 케이티 페리 덕분에 우주에도 글램이 존재하게 되었다. 바로 이런 이유 때문에 ‘대표성(representation)’이 중요한 것이고, 가능한 한 빨리 모든 여성들을 우주로 보내야 하는 것이다. 이번 주에 줌 회의에서 믿기지 않는다는 듯 눈썹을 치켜올리며 동료들에게 이렇게 말할 수 있었으면 좋겠다. “2025년 빙고 카드에 케이티 페리가 우주 가기는 없었는데요.” 하지만 역사상 가장 부유한 사람 중 하나인 제프 베이조스가 자금을 댄 로켓을 타고 팝스타가 무중력 상태로 둥둥 떠 있는 모습은, 사실 올해의 전개로 전혀 놀랍지 않다. 우리 대부분이 다음엔 어떤 경제 위기나 파시즘적인 정치적 움직임이 닥칠지 두려워하며 예측할 때, 페리 같은 계층에겐 걸린 것이 아무것도 없고, 바뀌어야 할 이유도 없다. 그래서 그들에게 ‘여성의 권한 강화(empowerment)’, ‘희망(hope)’, ‘회복력(resilience)’ 같은 개념들은 현실적인 의미를 갖지 않는다. 이 말들은 그저 인스타그램 캡션이나 노래 가사 속에서만 존재한다. 로켓을 우주로 보내는 데 쓰인 돈은 애초에 달리 사용할 방법조차 없는 돈이며, 지구에서 여성들이 직면한 문제들은 그들에게는 그저 사소한 뒷전일 뿐이니까. 이번 우주여행은 페리의 커리어로 봤을 때도 어쩌면 지극히 당연한 다음 단계일지 모른다. 솔직히 말하자면, 나도 공감 능력이 뛰어난 사람이기에 그녀의 마음을 이해한다. 만약 내가 2010년에 완벽한 노래 몇 곡을 발표한 뒤 그 마법을 다시는 재현하지 못했고, 그럼에도 불구하고 내 재산이 어쩌다 3억 5천만 달러에 달하게 되었다면, 나 역시 별을 향한 여행 속에서 삶의 의미를 찾아 떠났을 것이다. 그렇다고 해서 내가 과연 스스로에게 정직해져서, 이번 여행이 사실은 수백만 달러짜리 놀이기구를 타고 언론의 관심을 끌기 위한 홍보용 쇼였다는 점, 우리가 우주 혁명가가 아니라 단지 명품 옷을 입고 아마존이 돈을 내준 미디어 노출을 최대한 짜내고 있는 셀럽에 불과하다는 점을 세상에 인정할 수 있었을까? 글쎄, 누가 알겠는가. 나는 케이티 페리가 우주가 가진 경이와 신비, 그리고 모든 인간을 이어주는 보편적 진리에 약간이라도 호기심을 가지고 있다면, 불교 서적을 읽거나 상호부조 단체에 가입해 보면 좋겠다. 그런 책과 단체는 각각 1만 개쯤 떠오르는데, 그녀의 인생을 셀레나 고메즈가 소셜 미디어에서 잠깐 떠난 시간보다 더 짧았던 우주여행보다 훨씬 풍요롭게 만들어 줄 것이다. 하지만 아쉽게도 내가 이 모든 걸 생각한 건 이미 너무 늦었다. "우주비행사의 뒤태(ass)"는 이미 돌아와버렸으니까. 하지만 잠시 스스로를 돌아보고 반성해본다. 나는 혹시 한 여성에게 너무 많은 감정노동을 기대했던 게 아닐까? 케이티 페리는 이미 충분히 자신의 시간과 지혜를 아낌없이 나눴고, 운 좋게 그녀와 함께 우주에 갔던 여성들에게는 자신의 목소리까지도 선물했다. 그녀는 우리에게 ‘신성한 여성성’에 접속하는 법과 ‘발사되는 날 얼마나 사랑받는 느낌인지’에 대해, 그리고 심지어 피타고라스에 대해서까지 알려주었다. 그녀가 어떤 방식으로 ‘공간을 차지하든’ 그것은 모두 정당하다. 아마 그녀가 이번 우주여행에서 경험한 모든 것을 완전히 소화해내기까지는 시간이 걸릴 것이다. 그 순간이 오면, 그녀가 누구나 어디에서든 꿈을 이룰 수 있다는 메시지를 담은 노래를 써주었으면 한다. 세상에는 그런 노래를 간절히 필요로 하는 여성들이 너무나 많으니까.
작성자 : ㅇㅇ고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.