모든 주요 모델 출시 및 기능 업데이트 - 누가 무엇을 출시했는지, 가격 대비 성능의 경계를 어떻게 바꾸는지.
301 스토리
새로운 모델은 기능과 가격 대비 성능의 경계를 재설정합니다. 팀은 출시로 인해 달러당 가능한 것이 바뀔 때마다 무엇을 구축할지 재평가합니다.
<p><strong><a href="https://tools.simonwillison.net/openai-webrtc">OpenAI WebRTC 오디오 세션, 이제 문서 컨텍스트 포함</a></strong></p> 저는 이 도구의 첫 번째 버전을 만들었습니다. <a href="https://simonwillison.net/2024/D…
한 직원은 전 직원에게 공개된 포럼에 “이 회사가 더 이상 해커톤 문화를 지원하는지 잘 모르겠습니다.”라고 게시했습니다.
새로운 보고서에 따르면 6,500명의 직원을 고용하고 있는 이 부대가 반란 직전에 있다고 합니다.
WIRED가 검토한 소식통과 내부 토론에 따르면 임직원 모두는 메타의 혼란스러운 AI 전략으로 인해 어려움을 겪고 있습니다.
Google Research가 2026년 6월 12일에 발표한 텍스트-SQL 기능인 Gemini-SQL2를 살펴보겠습니다. Gemini 3.1 Pro를 기반으로 하는 이 제품은 BIRD 단일 모델 리더보드에서 80.04%의 실행 정확도를 기록했습니다. 우리는 점수가 무엇인지 설명합니다…
업계 최초의 에이전트 AI 벤치마크인 Artificial Analysis의 AgentPerf는 개발자, 기업 및 인프라 제공업체에 에이전트 AI용 시스템을 비교할 수 있는 명확한 방법을 제공합니다. 공개된 첫 번째 라운드에서…
이 게시물에서는 Rocket Close가 Strands Agent, LLM(대형 언어 모델), Amazon Bedrock, Amazon Bedrock Knowledge Bases 및 MCP(Model Context Protocol) 도구를 사용하여 솔루션을 구축한 방법을 살펴봅니다. 우리는 솔루션 Fe를 다루고 있습니다…
거대 기술 기업인 '아웃사이더 엔터프라이즈(Outsider Enterprise)'라는 그룹이 AI를 사용해 수십만 명의 피해자를 속이고 2주에 걸쳐 250만 개의 문자 메시지를 보냈다고 밝혔습니다.
물리적 AI를 다루는 유일한 스타트업은 아니지만 자금 지원이 가장 좋은 스타트업 중 하나입니다.
Anthropic은 거의 52,000명의 미국인을 대상으로 AI에 대한 희망과 두려움에 대해 조사했습니다. 64%는 실직을 두려워하고, 56%는 스스로 생각하는 능력을 잃는 것을 걱정합니다. 일일 AI 사용자는 훨씬 적습니다.
완전한 자율성은 드물지만 우크라이나는 드론과 로봇에 AI 모듈을 설치하고 있습니다.
이제 OpenAI를 사용하면 Codex 사용자가 속도 제한 재설정을 저장하고 고정된 일정에 따라 만료되는 것을 지켜보는 대신 수동으로 트리거할 수 있습니다. 세션 중간에 사용량 한도에 도달하면 저장된 재설정을 즉시 현금화할 수 있습니다.
거대 기술 기업인 '아웃사이더 엔터프라이즈(Outsider Enterprise)'라는 그룹이 AI를 사용해 수십만 명의 피해자를 속이고 2주에 걸쳐 250만 개의 문자 메시지를 보냈다고 밝혔습니다.
이런 날이 절대 오지 않을 거라고 생각했다면 용서받을 수 있을 것입니다. Siri는 "몇 가지 면에서 유용함"과 "완전히 비참한데, 내가 왜 시도했는지, 솔직히 설정조차 할 수 없는지…
Claude Fable 5는 64.9점으로 인공 분석 지능 지수 1위를 차지했으며 벤치마크 10개 중 5개에서 기록을 세웠습니다. 그러나 Opus 4.8에 대한 이익은 토큰 가격의 두 배인 5.7%에 불과합니다. F가 포함된 안전 필터
사기꾼들은 Gemini로 코딩된 사기 사이트를 통해 수십만 명의 사람들을 표적으로 삼은 것으로 알려졌습니다.
이 게시물은 Amazon Quick 및 Cisco Webex MCP 서버를 사용하여 맞춤형 회의 준비 및 후속 조치 도우미를 구축하는 방법을 보여줍니다. 단일 프롬프트에서 상담원은 예정된 Webex 미팅을 찾고, 이전 미팅 요약을 검토합니다.
이 게시물에서는 Amazon Bedrock과 그 기능을 기반으로 AWS에서 비용 효율적이고 확장 가능한 지능형 문서 처리 파이프라인을 개발하는 방법을 간략하게 설명합니다. BDA는 Amazon Bedrock 내의 관리형 서비스로, 자동으로…
뉴욕타임스와 CNBC의 보도에 따르면 아마존 창업자 제프 베조스는 자신의 새로운 AI 스타트업이 '인공 일반 엔지니어' 개발을 위해 노력할 것이라고 말했습니다. 프로메테우스(Prometheus)라는 스타트업은 AI-P 개발을 목표로 하고 있습니다.
AWS Professional Services(AWS ProServe)는 기존 프로세스에 인공 지능(AI) 도구를 추가하는 것이 아니라 서비스 제공 방법을 근본적으로 재구성하여 참여 일정을 몇 개월에서 며칠로 단축했습니다.
AI 훈련을 위해 Pokémon Go 데이터를 용도 변경하는 것은 계속해서 면밀한 조사를 받고 있습니다.
OpenAI는 사람들이 실용적인 AI 기술을 구축하고, 반복 가능한 워크플로를 만들고, 일상 업무에 에이전트를 적용하는 데 도움이 되는 세 가지 아카데미 과정을 소개합니다.
Moonshot AI의 Kimi Work는 macOS 및 Windows용 로컬 데스크톱 에이전트입니다. 300개 하위 에이전트 떼를 실행하고, WebBridge를 통해 로그인한 브라우저를 구동하고, 백그라운드 작업을 예약합니다. 포스트 문샷 AI, 키미워크 출시…
이 튜토리얼에서는 Medical Segmentation Decathlon Task09 데이터 세트에서 비장을 분할하기 위해 MONAI를 사용하여 엔드투엔드 3D 의료 이미지 분할 파이프라인을 구축합니다. 우리는 체적 CT 스캔 작업을 하고 의료 영상을 적용합니다…
'들어봐, 내가 여기 있는 이유는 그게 아니지, 그렇지?' | 이미지: Apple 초기 테스트에서는 Siri AI가 언제 종료해야 할지 알고 있다는 사실이 이미 나타났으며 이는 의도적으로 설계된 것입니다. Mostly Human과의 인터뷰에서 Craig Federighi는 다음과 같이 말했습니다.
iOS 27의 새로운 사진 앱의 생성 기능은 일부 사진에 가짜 픽셀을 추가하지만 Apple의 Jon McCormack은 회사가 "AI를 위해" AI를 사용하지 않는다고 말합니다.
Preply는 OpenAI를 사용하여 AI로 생성된 강의 요약을 시작하고 맞춤형 피드백과 언어 학습 연습을 제공합니다.
<p><a href="https://simonwillison.net/2026/Jun/9/claude-fable-5/">Claude Fable 5</a>를 이틀간 경험해 본 결과, 이를 설명하는 가장 좋은 방법은 <strong>끊임없이 적극적</strong>이라고 생각합니다. 그것은 많은 것을 알고 있습니다…
Deep Research는 이제 Perplexity Computer 내부에 상주하여 어려운 질문을 하위 작업으로 나누고 20개 이상의 프론티어 모델에 걸쳐 라우팅합니다. 포스트 Perplexity는 심층 연구를 컴퓨터로 이동하고 연구 하위 작업을 2개에 걸쳐 라우팅합니다…
Grok Build의 터미널 내 마켓플레이스는 모든 원격 플러그인에 대한 커밋 SHA 확인을 통해 기술, 에이전트, 후크 및 MCP 서버를 번들로 제공합니다. xAI, MongoDB, Vercel, Sentry, Ch와 함께 Grok 빌드 플러그인 마켓플레이스 출시…
Thibault Sottiaux는 AI 코딩을 OpenAI에서 가장 빠르게 성장하는 비즈니스 중 하나로 만드는 데 도움을 주었습니다. 이제 그는 ChatGPT의 대대적인 점검을 감독하고 있습니다.
이 게시물은 Amazon Bedrock의 주문형 추론 및 배치 추론 옵션으로 구성되어 문서 처리 시간과 작업 시간에 유연성을 제공하는 지능형 문서 처리 파이프라인을 보여줍니다.
Deezer는 Spotify, Apple Music 및 기타 플랫폼의 재생 목록을 검색하여 AI 음악을 식별하는 도구를 도입했습니다.
Deezer는 이제 모든 주요 스트리밍 플랫폼의 사용자가 AI 생성 노래가 재생 목록에 숨겨져 있는지 확인할 수 있는 무료 AI 음악 탐지기를 제공합니다. 기사 무료 Deezer 도구를 통해 사용자는 모든 스트리밍 서비스에서…
오늘 우리는 Quick Sight 대시보드를 더욱 풍부하고 비즈니스에 맞게 만드는 두 가지 새로운 기능인 스파크라인과 컨트롤에 대한 사용자 정의 정렬을 발표하게 되어 기쁘게 생각합니다. 이 게시물에서는 두 가지 기능을 모두 살펴보겠습니다.
Pool의 새로운 앱은 자동으로 스크린샷을 개인화된 컬렉션으로 분류하고 저장된 콘텐츠 뒤의 원본 링크를 추적하며 제품, 레시피, 여행 아이디어 및 기타 귀하가 의도했던 것들을 재발견하도록 도와줍니다.
<p><strong>릴리스:</strong> <a href="https://github.com/simonw/datasette/releases/tag/1.0a33">데이터세트 1.0a33</a></p> <p>이 알파는 안정적인 1.0으로 향하는 중요한 단계이며, 마침내 <code>?_extr…
Blueprint 지침 최적화는 이 문제를 직접 해결하기 위해 추출 지침을 자동으로 구체화하는 BDA 기능입니다. 예상 값이 포함된 예시 문서를 3~10개 제공하고 BDA는…
Ask DoorDash라고 불리는 새로운 챗봇을 사용하면 사용자는 카트를 만들기 위해 레스토랑이나 상점을 스크롤할 필요 없이 앱에서 원하는 것을 자신의 말로 검색할 수 있습니다.
Anthropic은 경쟁 시스템을 개발하기 위해 이를 사용하는 연구원과 경쟁사 모두를 약화시키는 숨겨진 가드레일을 사용하여 새로운 AI 모델인 Claude Fable 5를 은밀하게 조절한 것에 대해 사과했습니다. 회사에서는 반대라고 하는데...
이제 Hermes 에이전트 대시보드는 하나의 흐름으로 완전한 에이전트 프로필을 구축하여 사용자를 위한 다단계 CLI 설정을 대체합니다. Nous Research는 Hermes Agent Profile Builder: ID, 모델, 기술 및 MCP 서버를 출시했습니다.
이제 Deezer는 다른 스트리밍 플랫폼의 재생 목록을 스캔하여 AI 생성 음악을 감지합니다. Deezer는 AI 생성 음악에 라벨을 붙이기 시작한 최초의 대형 스트리밍 서비스였습니다. 심지어 다른 회사에 기술을 제공하기도 했습니다…
<p><strong>릴리스:</strong> <a href="https://github.com/simonw/asyncinject/releases/tag/0.7">asyncinject 0.7</a></p> <p>몇 가지 <code>asyncio</code> 종속성 주입 패턴을 지원하기 위해 이 유틸리티 라이브러리를 만들었습니다…
이번 결정은 인도가 세계 최대의 GCC 시장으로 떠오르면서 나온 것입니다.
그의 천재성을 의심했다면 더 이상 의심하지 마세요.
프론티어 팀은 단순히 코딩 속도를 높이기 위해 AI를 사용하는 것이 아닙니다. 그들은 소프트웨어 구축 방법을 재설계하고 있습니다. 그 결과 생산성이 4.5배, 경우에 따라 10배 이상 향상됩니다.
OpenAI는 AI 콘텐츠 투명성에 대한 EU 실천 강령을 지원하고 사람들이 AI 생성 콘텐츠를 이해하는 데 도움이 되는 출처 표준 및 도구를 발전시킵니다.
PyTorch 프로파일링(2부): nn.Linear에서 Fused MLP까지
천체 물리학자인 Chi-kwan Chan이 Codex를 사용하여 블랙홀 시뮬레이션을 구축하고 과학자들이 극한 물리학을 연구하고 아인슈타인의 일반 상대성 이론을 테스트하는 데 어떻게 도움이 되는지 알아보세요.
BBVA가 ChatGPT Enterprise를 직원 100,000명으로 확장하고 OpenAI와 협력하여 전 세계적으로 AI 기반 은행 혁신을 가속화한 방법을 알아보세요.
<p><strong>릴리스:</strong> <a href="https://github.com/datasette/datasette-agent/releases/tag/0.2a0">datasette-agent 0.2a0</a></p> <p>릴리스 노트의 주요 내용:</p> <blockquote> <ul> <li>이제 도구에서…
우리는 Microsoft SkillOpt를 위해 계측된 워크플로를 엔드 투 엔드로 구현합니다. 저장소를 설정하고, OpenAI 호환 모델 액세스를 연결하고, 최적화 도구와 대상 모델을 구성합니다. 오리지널 시드 스키를 평가합니다…
<p><strong><a href="https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text- Generation/">DiffusionGemma</a></strong></p> 지난 5월 Google은 실험적인 Gemini Diff를 간략하게 출시했습니다.
확산 AI는 이미지 생성에서 가장 일반적이지만 텍스트 출력을 훨씬 빠르게 만들 수 있습니다.
자동차 한 대가 도로변에 정차합니다. 앱에 "당신의 차량이 여기에 있습니다."라고 표시됩니다. 운전석에는 아무도 없습니다. 현재 로보택시 서비스를 제공하는 수십 개의 도시 중 하나에 거주하는 사람들에게 이는 이미 현실이 되었습니다. 로보택시 산업…
Anthropic은 방금 Claude Fable 5를 출시하여 지금까지 널리 사용 가능한 가장 강력한 AI 모델이라고 부르며 생물학 분야의 기술을 칭찬했습니다. 하지만 이 모델은 기본적인 생물학 질문에 답하지 않습니다.
전국의 대학 신입생들이 AI를 과대평가하는 졸업식 연설자들을 야유하고 야유해 왔습니다. Microsoft는 모든 사람이 이에 대해 이야기하기를 바랍니다. 3,100단어가 넘는 블로그 게시물에서 Microsoft 부사장은…
Anthropic의 보안 팀은 Mythos Preview AI 모델이 전문 지식 없이 수천 달러를 들여 Firefox 및 Windows 커널용 보안 패치를 몇 시간 만에 작동 가능한 공격으로 전환할 수 있다는 사실을 발견했습니다.…
독립 음악가 그룹이 Google이 업로드한 동영상을 통해 Lyria를 교육했다고 주장하며 Google을 고소했습니다. | 이미지: Cath Virginia / The Verge YouTube에 노래를 업로드한 경우 Google은 귀하의 동영상을 공정한 게임으로 간주할 것이 거의 확실합니다.
Anthropic은 어제 최초의 Mythos급 AI 모델인 Claude Fable을 출시했으며 이는 이미 Microsoft 내부에서 우려를 불러일으키고 있습니다. 소식통에 따르면 Microsoft는 다음과 같은 이유로 직원의 Claude Fable 5 사용을 제한하고 있습니다.
Google에서는 검색과의 상호작용을 저장하는 방법을 일부 변경하고 있습니다. Google은 사용자에게 보낸 이메일에서 사용자가 검색하는 데 사용하는 이미지, 파일, 오디오 및 비디오를 새로운 '검색 서비스 기록…
새로운 연구에 따르면 AI 메모리 시스템은 모델 성능을 저하시키고 사교적인 경향을 조장할 수 있습니다.
사이버 보안 연구원들은 Anthropic의 새로운 모델 Fable이 어떤 사이버 보안 작업에도 너무 엄격한 가드레일을 가지고 있다고 불평하고 있습니다.
오늘 우리는 AWS Trainium 및 AWS Inferentia를 기반으로 구축하는 개발자가 이를 가능하게 하는 AI 에이전트 및 기술 모음인 Neuron Agentic Development 기능을 발표합니다. 이 게시물에서는 방법을 설명합니다…
<blockquote cite="https://twitter.com/jeremyphoward/status/2064595816875217362"><p>재귀적 AI 자체 개선 속도를 늦추는 손쉬운 솔루션:</p> <ul> <li>최상위 모델을 보유한 연구실은 이를 사용해서는 안 된다는 데 동의해야 합니다…
이 게시물에서는 농부와 현장 기술자가 장비 문제를 진단하고, 필요한 부품을 식별하고, 제조업체 앱에 액세스하는 데 도움이 되는 Amazon Bedrock AgentCore를 사용하여 AI 기반 장비 수리 도우미를 구축합니다.
ACLU는 아동 유괴 사건에서 포트마이어스 남성을 체포한 플로리다 경찰서 2곳을 고소하면서 경찰관들이 결함이 있는 얼굴 인식 일치를 거의 확실한 신분증으로 취급했다고 밝혔습니다.
Anthropic은 새로운 Mythos 클래스의 첫 번째 모델인 Claude Fable 5를 출시했습니다. SWE-bench Verified를 포함한 거의 모든 벤치마크를 95%로 앞서지만 비용은 마일당 10~50달러로 Opus 4.8의 두 배입니다.
Decart는 자율주행차 테스트를 위한 사실적인 운전 환경을 생성하는 실시간 세계 모델인 Oasis 3를 출시합니다. 이제 개발자가 API를 통해 구축할 수 있습니다.
Google은 NotebookLM에 대대적인 업그레이드를 제공합니다. 연구 도구는 이제 Gemini 3.5 Flash에서 실행되고 코드 실행을 위한 자체 클라우드 컴퓨터가 있으며 Google 검색을 통해 자체적으로 소스를 찾을 수 있습니다. 내부 테스트에서 새로운…
소프트웨어 개발이 바뀌었습니다. 엔지니어는 더 이상 대부분의 코드를 직접 입력하지 않습니다. 의도를 설명하고 AI 에이전트가 작업을 수행합니다. 최신 도구는 작업을 계획하고, 파일을 편집하고, 테스트를 실행하고, 끌어오기 요청을 엽니다. 현재 다수가 배송 중입니다…
아르헨티나 국가대표팀은 월드컵 기간 동안 Google의 테스트 벤치이자 기술 쇼케이스가 될 것입니다.
Claude Fable 5는 일반적으로 분류기와 함께 제공됩니다. Mythos 5는 제한된 상태를 유지하고 Project Glasswing을 통해 사이버 보호 조치가 해제되었습니다. 포스트 Anthropic은 Claude Fable 5와 Claude Mythos 5를 출시합니다: 동일한 기본 모드…
이 튜토리얼에서는 코드 사전 훈련 연구를 위한 대규모 메타데이터 인덱스로 NVIDIA의 Nemotron-Pretraining-Code-v3 데이터 세트를 사용합니다. 데이터세트를 다운로드하는 대신 스트리밍하고, 스키마를 검사하고, 빌드합니다.
<p><strong><a href="https://jonready.com/blog/posts/claude-fable5-is-allowed-to-sabotage-your-app-if-youre-a-competitor.html">Claude Fable이 도움을 중단하면 결코 알 수 없습니다</a></strong></p> Jonathon Ready의 성공…
LSEG가 OpenAI를 사용하여 글로벌 비즈니스 전반에 걸쳐 신뢰할 수 있는 AI를 확장하고 통찰력을 가속화하고 릴리스 주기를 단축하며 4,000명의 직원에게 역량을 부여하는 방법을 알아보세요.
<p>오늘의 <a href="https://www.anthropic.com/news/claude-fable-5-mythos-5">Claude Fable 5</a> 릴리스에 미리 액세스할 수는 없었지만 지난 5.5시간 동안 진행해 보았습니다. 내 첫인상은…
시리, 거기 있어? 부모가 AI에서 원하는 것은 단 한 가지입니다. 즉, 축구 경기 목록이나 이메일의 "영혼 주간" 테마 날짜 또는 형식이 잘못된 전단지를 달력에 한 번에 추가하는 것입니다. 그리고 나는…
<p><strong>릴리스:</strong> <a href="https://github.com/simonw/llm/releases/tag/0.32a3">llm 0.32a3</a></p> <p>거의 전적으로 새로운 Claude Fable 5가 작성했습니다. <a href="https://simonwillison.net/2026/Jun/9/claude-…
<p><strong>TIL:</strong> <a href="https://til.simonwillison.net/llms/agentsview-custom-model-price">AgentsView에서 모델에 대한 사용자 정의 가격 설정</a></p> <p>정말 즐거운 시간을 보냈습니다 <a href="https://agentsview.io/">...
Microsoft AI CEO인 Mustafa Suleyman은 Anthropic이 "헌법" 내에서 Claude의 의식이나 모델의 행동 방법을 알려주는 지침에 대해 추측하는 것은 "정말, 정말 위험하다"고 말합니다. 동안…
음성 에이전트가 이중 언어 고객을 처리할 수 있습니까? 코드 전환 음성에 대한 Frontier ASR 벤치마킹
새로운 프론티어 모델은 사이버 보안, 생물학 및 화학 쿼리를 거부합니다.
<blockquote cite="https://twitter.com/karpathy/status/2064409694761054332"><p>작동하는 소프트웨어가 점점 탭 한 번으로 출시되면서 많은 것들이 변하고 있음을 느낍니다. Jevon의 역설이 시작되고 나는 이에 대한 나 자신의 요구를 느낍니다…
음성 번역은 보안을 위해 SynthID 워터마크를 사용하여 화자의 어조, 속도, 음조를 보존합니다.
Anthropic은 특히 코딩과 연구 분야에서 현재 Opus 세대를 압도한다고 주장하는 두 가지 새로운 모델인 Claude Fable 5와 Mythos 5를 출시합니다. Fable 5는 Stripe에 대한 코드 마이그레이션을 하루 만에 완료했습니다.
Apple은 주로 다른 대부분의 발표와 마찬가지로 AI의 큰 도움을 받았던 오랫동안 Siri 비서를 통해 향상된 경험을 제시했습니다.
Gemini 3.5 Live Translate는 70개 이상의 언어로 음성 대 음성 번역을 스트리밍합니다. 스피커 뒤에서 몇 초 동안 머물면서 지속적으로 오디오를 생성합니다. 이 모델은 Gemini Live API를 통해 개발자에게 전달됩니다.
Google은 70개 이상의 언어에 대한 실시간 번역을 위한 오디오 모델인 Gemini 3.5 Live Translate를 출시했습니다. 시스템은 문장이 끝날 때까지 기다리지 않고 지속적으로 번역하며 언어를 보존한다고 주장합니다…
Anthropic은 Claude Mythos 5를 신뢰할 수 있는 조직에 공개하고 Claude Fable 5를 대중에게 공개합니다. 이 버전은 사이버 공격에 사용할 수 없습니다.
Anthropic은 최근 자사가 널리 출시한 모델 중 가장 강력한 새로운 AI 모델인 Claude Fable 5를 발표했습니다. 회사에 따르면 페이블 5는 "소프트웨어 엔지니어링, 지식 분야에서 탁월한 성능을 보여준다.
Anthropic은 대중에게 공개되는 최초의 Mythos급 모델인 Claude Fable 5를 출시합니다. 이 모델에는 사이버 보안 및 생물학과 같은 고위험 영역의 대응을 차단하는 가드레일이 함께 제공됩니다.
이 게시물에서는 핸즈프리 FNOL 접수 시스템이 도메인 추론을 위해 Strands Agents SDK로 구축된 에이전트와 라이브 포털 상호 작용을 위한 Amazon Bedrock AgentCore 브라우저 도구를 결합하는 방법을 보여줍니다. 이 접근법은…
WWDC 2026에서 Apple의 기능 쇼케이스에서는 이러한 "사진"이 실제인지 아니면 새로운 AI 가짜로 생성되었는지 표시하지 않았습니다. | 이미지 제공: Apple / 편집: The Verge Apple은 생성 AI 기반 전자…
이 게시물에서는 엔지니어링 팀이 엔지니어링에서 가장 시간에 민감한 워크플로우 중 하나인 사고 분류에 해당 원칙을 적용하는 방법을 보여줍니다. Amazon Quick을 사용하여 사용자 정의 사고 분류 보조 에이전트를 구축합니다.
SpaceX, Anthropic 및 OpenAI가 모두 대규모 공개 데뷔를 목표로 하고 있기 때문에 기술 산업은 곧 새로운 종류의 기업 지배자와 그에 걸맞은 새로운 약어를 갖게 될 것입니다. FAANG에게 작별 인사를 하고 MANGOS에게 인사하세요.
North Mini Code 소개: 개발자를 위한 Cohere의 첫 번째 모델
Gemini 3.5 Live Translate는 Google AI Studio, Google Translate 및 Google Meet에 거의 실시간에 가까운 자연스러운 음성 번역을 제공합니다.
마이크로소프트 AI 수장 무스타파 술레이만(Mustafa Suleyman)은 변호사, 회계사, 프로젝트 관리자 등 사무직 근로자가 수행하는 AI 자동화 작업에 대한 자신의 성명을 철회했습니다. 월요일 디코더 에피소드에서 Suley는…
Apple은 AI에 대한 대담한 약속으로 연례 개발자 컨퍼런스를 시작했습니다. CEO인 팀 쿡(Tim Cook)은 회사가 "가능한 것의 한계를 뛰어넘는 새로운 기술과 혁신을 도입할 것"이라고 말했습니다. 하지만 정말 많이…
Apple의 현재 AI 아이디어 대부분은 다른 모든 AI 아이디어와 거의 동일합니다. 질문할 수 있는 챗봇; 텍스트를 생성하거나 요약하는 빠른 방법; 기괴하고 경계선에 있는 소름 끼치는 이미지 생성 도구입니다. 회사는…
일부 모델은 Google 클라우드에서 실행되지만 Google에 어떤 종류의 액세스 권한도 부여하지 않습니다.
WWDC 2026에서 Apple은 재구성된 Siri 버전을 선보였습니다. 어시스턴트는 Google과 함께 개발된 기반 모델에서 실행됩니다. 복잡한 쿼리의 경우 Nvidia GPU를 활용합니다. 기사 Apple Intelligence가 H로 두 번째 기회를 얻습니다…
OpenAI는 2028년까지 완전 자율 AI 연구에서 물러나 이제 인간과 기계 간의 "탠덤"에 대해 이야기하고 있습니다. Altman과 Pachocki는 또한 다음과 같은 경우 국경 개발을 늦출 수 있는 국제 기구를 요구합니다.
2019년 알렉스 빈드먼(Alex Vindman)은 트럼프 대통령의 첫 번째 탄핵 재판에서 증언했는데, 이 결정으로 그의 군 경력이 끝났습니다. 이제 그는 의회 홀에서 대통령에게 도전하고 싶어합니다.
AI 에이전트 채택이 향후 2년 동안 300%나 급증할 것으로 예상됨에 따라 리더십 팀은 하이브리드 인간-AI 인력의 영향을 신중하게 고려하고 있습니다. 기존 기업급 자동화와는 다르게…
지난주 SXSW 런던에서 저는 "AI에 대해 알아야 할 5가지"라는 주제로 강연을 했으며, 현재 AI의 가장 큰 주제라고 생각하는 내용을 공유했습니다. 저는 연례 GUI인 첫 번째 AI10 목록에서 몇 가지를 가져왔습니다.
새로운 Harvard 및 Perplexity 논문은 일치 쌍 세션을 사용하여 자율 에이전트와 검색 도우미를 비교합니다. 자율성, 시간, 비용 면에서 큰 이득을 얻을 뿐만 아니라 시도된 작업 범위도 더 넓어집니다. 포스트 A Ne…
애플의 새로운 인공지능이 애플이 가장 중요한 산업 경쟁에서 지고 있다는 비난을 잠재울 수 있을까?
<p>Apple의 <a href="https://simonwillison.net/2024/Jun/10/apple-intelligence/">2024 WWDC Apple Intelligence 발표</a>를 액면 그대로 받아들이는 사람이 얼마나 큰 상처를 받았는지를 생각하면 저는 엄격한 "믿겠습니다…
Apple은 Safari의 가장 큰 약점 중 하나를 AI로 해결하려고 노력하고 있습니다. Safari에는 주로 Apple의 엄격한 개발 요구 사항으로 인해 경쟁사에 비해 강력한 확장 라이브러리가 부족했습니다. 하지만 지금은…
올 가을 2계층의 Google 기반 AI 모델 점검과 함께 새로운 기능이 출시될 예정입니다.
Apple의 WWDC 2026 이벤트는 오늘 아침 오전 10시(태평양 표준시) Apple Park에서 시작되었으며, 개발자 이벤트 및 데모와 함께 Siri, iOS 27, Apple Intelligence 등에 대한 예상 발표로 가득한 한 주를 시작했습니다. 이…
NotebookLM이 대대적으로 업그레이드되고 있지만 현재는 AI Ultra 및 기업 계정에만 해당됩니다.
Apple은 Safari, 단축어 및 비밀번호 앱에 새로운 AI 기반 기능을 추가하고 있습니다.
바로가기는 AI 업그레이드를 통해 프롬프트에서 원하는 작업 흐름을 설명할 수 있습니다.
Apple의 AI 이미지 생성기가 더욱 경쟁력을 갖출 수 있도록 개조되고 있습니다.
새로운 공간적 '리프레임' 기능을 통해 사용자는 AI를 사용하여 관점을 조정할 수 있습니다.
73개의 패키지는 AI 에이전트가 열자마자 자체 복제 스틸러를 실행합니다.
Siri가 마침내 자체 앱을 갖게 되었습니다.
Apple 소프트웨어 부문 부사장 Sebastien Marineau-Mes는 "친구들과 함께 식사를 하고 iPhone으로 청구서를 가리키면 주문한 것을 선택하여 Apple Cash로 탭을 분할할 수 있습니다"라고 말했습니다.
독립 실행형 앱부터 Google Gemini 파트너십까지 Apple의 다가오는 Siri 개편에 관해 WWDC 2026에서 알아야 할 모든 것이 여기에 있습니다.
새로운 "Siri AI"의 기본 아이디어는 비서를 음성 제어 비서에서 더 많은 일을 할 수 있는 AI 동반자로 바꾸는 것입니다.
Amazon은 티셔츠, 물병, 후드티와 같은 제품에 대해 쇼핑용 Alexa를 사용하여 만든 AI 생성 디자인으로 주문형 인쇄 기능을 확장하고 있습니다. 쇼핑객은 텍스트 프롬프트를 사용하여 다음과 같은 이미지를 생성할 수 있습니다.
Apple Intelligence와 완전히 실현되지 않은 더 스마트한 Siri에 대한 계획을 처음 공개한 지 2년 후, Apple은 WWDC에서 새로운 AI 기능 세트와 더 스마트하고 개인화된 Siri를 공개했습니다. 애플이 부른다…
WIRED에서 확인된 코드는 회사의 스마트 안경용 앱인 Meta AI의 최신 버전에서 사라졌습니다. 메타는 왜 돌아올지, 돌아올지 여부를 밝히지 않을 것입니다.
Amazon Bedrock AgentCore Runtime은 각 에이전트 세션에 영구 작업 공간, 게이트웨이를 통한 보안 도구 액세스 및 내장된 관찰 기능을 갖춘 격리된 자체 microVM을 제공하므로 Claude Code, Codex, Kiro 등을 실행할 수 있습니다.
이 게시물에서는 수학적 최적화를 소개하고, 그것이 더 넓은 AI 환경에 어떻게 적용되는지 설명하고, 혁신 센터가 고객과 협력하여 명확한 결과를 제공한 실제 성공 사례를 소개합니다.
이 블로그는 이전에 안전한 실시간 추론을 위해 Amazon SageMaker 엔드포인트를 사용하여 완전 동형 암호화 활성화 게시물에서 ML 추론을 위한 FHE에 대해 논의했지만 이 게시물에서는 조금 더 자세히 설명합니다. 그 이전…
이 게시물에서는 Amazon Quick ARN의 구조를 다루고 이를 활용하기 위한 실용적인 정신 모델을 제공합니다. 결국 ARN을 보고 이것이 마이그레이션 전략에 어떤 의미인지 즉시 이해할 수 있습니다.
Google은 NotebookLM에 대한 "전반적인" 업데이트를 출시하고 있습니다. AI 기반 메모 작성 앱은 이제 Google의 업그레이드된 Gemini 3.5 모델을 사용하여 "더 정확하고 신뢰할 수 있는 정보"로 응답할 수 있습니다.
KPMG 조사에 따르면 기업 중 26%만이 AI 비용을 완벽하게 파악할 수 있는 것으로 나타났습니다. 대부분의 기업이 AI 지출에 대해 맹목적으로 행동하고 있다는 기사가 The Decoder에 처음 게재되었습니다.
OpenAI는 SEC에 기밀 S-1 제출을 확인했지만 아직 추가 조치 시기를 결정하지 않았습니다.
오늘 저는 Microsoft AI의 CEO인 Mustafa Suleyman과 이야기를 나눠보겠습니다. 그리고 사실 오늘의 서론은 짧게 하려고 합니다. 영상에서 보시겠지만 저는 이번 주에 아내의 가족 농장에서 일하고 있습니다. 하지만 이 또한…
무작위 대조 시험의 결과는 참여도를 높이고 학습을 가속화하는 Gemini의 안내 학습 기능의 잠재력을 보여줍니다.
Meta는 처음으로 Instagram용 AI 지원 챗봇의 보안 침해 수치를 기록했습니다. 최소 20,225개의 계정이 손상되었습니다. 거의 7주 동안 시스템은 중재자에게 비밀번호 재설정 링크를 보냈습니다.
머신러닝에는 한계가 있습니다. 어떻게 사용되고 있나요?
올해 Apple의 가장 큰 이벤트가 곧 다가옵니다. 회사의 세계 개발자 회의(Worldwide Developers Conference)에서는 iOS, macOS 및 기타 모든 Apple 운영 체제에 대한 업데이트를 조명할 예정이며, 올해 행사에는…
엄마들은 지루한 집안일을 ChatGPT에 아웃소싱하고 다른 사람들에게도 같은 일을 하도록 가르치는 강좌를 판매하고 있습니다. 아빠들은 다 어디 계시나요?
Microsoft AI는 사내 음성-텍스트 제품군의 두 번째 버전인 MAI-Transcribe-1.5를 출시했습니다. 이 모델은 43개 언어를 다루고, 도메인별 용어에 대한 키워드(엔티티) 바이어스를 추가하고, 2.4% Word-Error-R을 게시합니다.
1년 전 런던 기술 주간(London Tech Week)에서 NVIDIA 창립자이자 CEO인 Jensen Huang과 영국 총리 Keir Starmer는 다음과 같이 선언했습니다. 영국은 AI 수용자가 아닌 AI 메이커가 될 것입니다. 올해 행사에서 NVIDIA와 파트너는…
OpenAI가 AGI가 모든 사람에게 혜택을 줄 수 있도록 노력하면서 접근, 안전, 공동 번영에 초점을 맞춘 AI의 미래에 대한 비전입니다.
OpenAI는 AI가 일자리, 생산성 및 경제에 미치는 영향을 연구하기 위해 경제 연구 교류(Economic Research Exchange)를 시작합니다. 이제 선택된 연구 프로젝트에 대한 지원서가 공개되었습니다.
<p><strong>릴리스:</strong> <a href="https://github.com/datasette/datasette-agent-edit/releases/tag/0.1a0">datasette-agent-edit 0.1a0</a></p> <p><a href="https://agent.datasette.io/">Da…
엔비디아와 두산그룹은 두산로보틱스, 두산밥캣, 두산에너빌리티, 두산컴퍼니 등 물리적 AI, 로봇공학, AI 공장 인프라 전반에 걸쳐 새로운 기회를 창출하기 위해 협력을 확대하고 있습니다.
대형 AI 기업이 상장을 계획함에 따라 가격 인상이 더 많이 발생할 가능성이 높습니다.
Amazing Digital Dentures(실패한 프로젝트)
Mythograph Atelier #1 - 당신에게 의미가 있는 추상 미술
Notion의 제품 책임자는 "이것을 RT하는 사람들의 수"에 "놀랐다"고 말했습니다.
이 튜토리얼에서는 작은 언어 모델이 다단계 산술 단어 문제를 해결하는 방법을 개선하기 위해 반사 프롬프트 진화 프레임워크로 GEPA를 사용합니다. 우리는 약한 시드 프롬프트에서 시작하여 결정론적 벤치마를 구축합니다.
OpenAI 고위 직원에 따르면 "채팅은 죽었다"라고 합니다.
크리에이티브 에이전시 The Clueless의 AI 아바타 Aitana Lopez. | 이미지: The Clueless 이것은 기술 세계의 한 가지 핵심적인 이야기를 분석하는 주간 뉴스레터인 The Stepback입니다. AI 혼란에 대한 자세한 내용을 보려면 Robert Har를 따르십시오.
특히 코덱스에 대한 OPENAI CODEX 바우처 사용을 후원합니다 - openAI challange
OpenAI는 출시 이후 ChatGPT에 대한 최대 점검을 계획하고 있습니다. 챗봇은 코딩 도구, AI 에이전트, Canva 및 Booking.com과 같은 파트너 앱을 묶는 "슈퍼앱"이 될 것입니다. "채팅이 끝났습니다"라고 회사는 말합니다…
AI 시스템은 얼마나 정확해야 합니까?
Perplexity의 새로운 "코드로 검색" 아키텍처는 엄격한 검색 API를 버리고 AI 모델이 Python에서 자체 검색 루틴을 작성할 수 있도록 합니다. 에이전트가 샌드박스 내에서 자체 필터링 및 중복 제거를 처리하도록 함으로써…
ChatGPT를 위한 OpenAI의 새로운 잠금 모드는 웹 액세스, Deep Research 및 에이전트 모드를 비활성화하여 즉각적인 주입 공격을 통한 데이터 도난을 더욱 어렵게 만듭니다. 이 모드는 이러한 공격을 완전히 방지하지는 못하고 최종 공격만 차단합니다…
로우코드 및 노코드 AI 플랫폼은 이제 프롬프트를 작동하는 앱, 에이전트 또는 모델로 전환합니다. 이 가이드는 앱 빌더, 자동화, AI 에이전트 및 기계 학습 플랫폼 전반에 걸쳐 각각 해당 공식과 연결된 21가지 도구를 비교합니다.
지난 주 COMPUTEX에서 열린 GTC 타이페이에서 NVIDIA는 개인 AI 에이전트 시대를 위해 Windows PC를 재창조하는 슈퍼칩인 RTX Spark를 공개했습니다. 이번 발표에 이어 NVIDIA 창립자이자 CEO인 Jensen Huang은…
UIUC 및 Chroma의 Harness-1은 상태 기반 검색 하니스 내에서 강화 학습으로 훈련된 20B 검색 하위 에이전트입니다. 하네스는 부기를 유지합니다 — 후보자 풀, 중요도 태그가 지정된 큐레이트 세트, 증거…
잠금 모드를 사용하더라도 ChatGPT는 여전히 즉각적인 주입에 취약할 수 있지만 목표는 프로세스에서 민감한 데이터가 공유될 가능성을 줄이는 것입니다.
다섯 개의 연구소, 다섯 개의 마음: 작은 모델을 바탕으로 다중 모델 금융 드라마 구축
Apple의 WWDC가 다가옵니다. 여러분이 기대할 수 있는 사항은 다음과 같습니다.
President Donald Trump said he's discussing deals "where the American people can benefit from the success of AI."
An AI-generated image of the royal family featuring two Queen Elizabeth IIs. | Image: Meta AI Facebook has long been filled with feeds of clickbait articles. Now, Meta is making its own clickbait articles with AI. The s…
Our first glimpse of the new AI Siri came all the way back at WWDC 2024. Apple has been on its back foot, AI-wise, for the past few years. But in a strange way, playing from behind might not be such a bad move. At WWDC…
Elon Musk's xAI used Anthropic's Claude to train its own coding models for months and kept going even after Anthropic cut off access, using private accounts and the Blackbox AI service. Meanwhile, xAI's pretraining team…
Plus: Hackers use Meta’s AI bots to hack Instagram accounts, Anthropic helps NSA hackers, a decades-long GPS satellite mystery may have been solved, and more.
NVIDIA released Nemotron 3.5 ASR, a cache-aware 600M streaming model transcribing 40 language-locales in real time from one checkpoint. The post NVIDIA Releases Nemotron 3.5 ASR: A 600M-Parameter Cache-Aware Streaming M…
Alibaba's Qwen team has released Qwen3.7-Plus, a multimodal agent model that combines visual perception, GUI operation, and coding in a single agent loop. In a demo, an agent built on the model autonomously developed a…
<p><strong>Release:</strong> <a href="https://github.com/simonw/micropython-wasm/releases/tag/0.1a2">micropython-wasm 0.1a2</a></p> <p>I added a CLI to <code>micropython-wasm</code> (<a href="https://github.com/simonw/m…
<p>I've been experimenting with different approaches to running code in a sandbox for several years now, but my latest attempt feels like it might finally have all of the characteristics I've been looking for. I've rele…
<p><strong><a href="https://help.openai.com/en/articles/20001061-lockdown-mode">OpenAI Help: Lockdown Mode</a></strong></p> OpenAI first teased this <a href="https://openai.com/index/introducing-lockdown-mode-and-elevat…
Set up Qualcomm AI Hub Models to run MobileNet-V2 inference, YOLOv7 detection, and compile models on real devices. The post A Hands-On Coding Tutorial on Qualcomm AI Hub Models for Classification, Object Detection, and…
Applications for Startup Battlefield 200 officially close on June 8, 11:59 p.m. PT. Don't wait any longer. Secure your shot at competing on the Disrupt Stage at TechCrunch Disrupt 2026 this October at San Francisco's Mo…
Compare Gemma 4 edge formats: BF16, Q4_0 QAT, and mobile QAT, on published memory numbers and design tradeoffs. The post Google DeepMind Releases Gemma 4 QAT Checkpoints: Q4_0 and a New Mobile Format Cut On-Device Memor…
We're now deep into developer conference season, and one of the themes so far is the relentless conviction from Big Tech companies that AI is going to change everything about how we do everything. Nvidia's Jensen Huang…
The Air succeeds as a minimalist, reliable fitness tracker, but Google's AI Health Coach feels unnecessary.
Microsoft CEO Satya Nadella has sharply criticized an internal memo proposing to make users "addicted" to the company's new AI agent Scout. "Not sure who is writing and leaking this nonsense," Nadella wrote to about 50…
Microsoft’s AI products aren’t selling, and Github’s been plagued with troubles. WIRED spoke with VP Scott Hanselman about whether the company is in catch-up mode.
"The whole conversation shifted from tokenmaxxing and 'go fast' to 'we need guardrails, how do we control this?'"
Here are Google’s latest AI updates from May 2026
When Quilty hit the industry trades earlier this year, the AI startup promised that its tool could accurately predict a film's success just by reading the script. When people actually got a chance to experiment with Qui…
Microsoft sells its LLM training approach as different from other AI companies. It isn't. The company trained its new MAI models partly on unlicensed web data like Common Crawl, despite claiming they used only "clean an…
Anthropic has reportedly stationed about half a dozen engineers directly at the NSA to adapt its Mythos AI model for offensive cyber operations. The model could be used to break into networks in China or Iran. That fits…
<blockquote cite="https://ladybird.org/posts/changing-how-we-develop-ladybird/"><p>We will no longer accept public pull requests. [...]</p> <p>A substantial patch used to imply substantial effort, and that effort was a…
NVIDIA Dynamo Snapshot checkpoints and restores vLLM inference workers on Kubernetes using CRIU and cuda-checkpoint tools. The post NVIDIA AI Releases Dynamo Snapshot: A CRIU-Based Fast Startup System for AI Inference o…
Perplexity AI announces a hybrid local-server inference orchestrator for Personal Computer, automatically routing AI tasks between on-device and cloud models. The post Perplexity AI Introduces Hybrid Local-Server Infere…
A hands-on guide to running Microsoft Fara in Colab, testing the browser agent loop with a mock endpoint. The post Microsoft Fara Tutorial: Run a Browser-Use Agent in Google Colab with a Mock OpenAI-Compatible Endpoint…
On June 5, 404 Media reported that attackers had been using Meta’s AI customer support agent to steal Instagram accounts. Their approach was simple: They asked the agent to link the accounts to email addresses that they…
AI companies are using serif to project humanity. Critics are calling it “tasteslop.”
Anthropic is sharing internal data showing how much Claude is speeding up its own AI development: more than 80 percent of production code now comes from Claude, and engineers are shipping eight times as much code per da…
Home to cutting-edge sovereign AI infrastructure and robotics innovators, as well as one of the world’s most passionate gaming communities, South Korea is one of the world’s centers of AI. NVIDIA founder and CEO Jensen…
In the current environment, remaining heads down has diminishing returns; at some point, you have to make some noise just to remind the market you exist.
<p><strong><a href="https://charitydotwtf.substack.com/p/ai-enthusiasts-are-in-a-race-against">AI enthusiasts are in a race against time, AI skeptics are in a race against entropy</a></strong></p> Charity Majors neatly…
The Airbnb CEO said last year it hasn't struck an LLM partnership because existing products weren't quite ready.
This tutorial walks through a complete NLP pipeline for research-level mathematics. Using the ResearchMath-14k dataset, we extract field-specific keywords with TF-IDF, generate sentence embeddings, visualize the problem…
Robot demonstrations can distort public perceptions of robotic capabilities.
Poke, the startup that lets people use AI agents through simple text messages, has become the first AI agent approved for Apple’s Messages for Business platform.
Nemotron 3.5 Content Safety: Customizable Multimodal Safety for Global Enterprise AI
Bot traffic now outpaces human traffic on the internet, Cloudflare CEO Matthew Prince says, years ahead of his late 2027 forecast. He blames AI agents for the surge. His conclusion for the future of the web: "Clearly it…
Deploy NVIDIA Nemotron 3 Ultra on Amazon SageMaker JumpStart. Get 5x faster inference and 30% lower cost for agentic AI workloads with this frontier reasoning model.
ChatGPT's updated "Dreaming" memory system now builds coherent user profiles from conversations instead of saving scattered bullet points. OpenAI says the success rate for keeping information current jumped from 52.2 pe…
<blockquote cite="https://www.404media.co/google-employees-internally-share-memes-about-how-its-ai-sucks/"><p>After this story was published Google's spokesperson reached out and asked us to publish a slightly different…
Creators often have to parse through charts and dashboards to understand their performance, but with the new AI assistant, they can get quick answers to questions like "When should I post?" and "What are people saying i…
Apple's WWDC nears: Here's what you can look forward to.
According to a Bain survey of 951 companies, almost 40 percent achieved less than 10 percent in AI cost savings, even though most had targeted 11 to 20 percent. One alleged reason is that only 7 percent actually run ful…
Taiwan Semiconductor Manufacturing Co. - the world's biggest semiconductor-maker - is struggling to meet demands from American customers even with its factory buildout in the US, according to reports from Reuters and Bl…
Today on Decoder, I’m talking to Ryan Mac, a technology reporter at The New York Times and coauthor of the excellent book Character Limit: How Elon Musk Destroyed Twitter, which came out in 2024. I can’t recommend it en…
OpenAI CEO Sam Altman outlines the next phase of AI products: a "proactive AI" that runs constantly in the background and acts on its own instead of waiting for user prompts. Companies are also wrestling with spiraling…
June’s forecast with GeForce NOW: 100% chance of gaming. GeForce NOW is lining up new adventures for the month, from big-name blockbusters to quirky indies ready for the spotlight. Members can dive into fresh worlds, sq…
How to Fine-Tune Nemotron 3.5 ASR for Your Language, Domain, or Accent
Nobody should be subjected to seeing shrimp Jesus all over their social feeds. | Image: Cath Virginia / The Verge, Getty Images It's almost impossible to avoid seeing AI-generated content online, but it doesn't have to…
EVA-Bench Data 2.0: 3 Domains, 121 Tools, 213 Scenarios
Some of the AI industry's biggest rivals have put their many, many grievances aside for a common cause: making it harder for people to use their technology to develop biological weapons. In an open letter to US lawmaker…
Learn how Endava is using AI agents, ChatGPT Enterprise, and Codex to accelerate software delivery, automate workflows, and build an AI-native culture across the enterprise.
The design hasn’t changed much from the original Proteus, which was announced in 2022. | Image: Amazon Amazon has announced a new version of its fully autonomous warehouse robot, Proteus, that will interact using langua…
ChatGPT introduces a new memory system to better remember preferences, keeping context fresh and relevant across conversations.
xAI has released "grok-imagine-video-1.5-preview," an image-to-video model that turns still images into cinematic videos at up to 720p based on text prompts. Multiple clips can be stitched together into longer scenes. T…
The model handles long documents, images and audio in a single context window, expanding the design space for agentic and retrieval-heavy workloads.
Leading AI labs, executives, and scientists are sending a letter to lawmakers urging them to improve tracking of synthetic DNA sequences that could be used for bioweapons.
Designing the hf CLI as an agent-optimized way to work with the Hub
An action plan for AI-powered biological resilience
Lovable and Google signed an expanded multiyear deal that involves a 5x expansion of Lovable's footprint on Google Cloud, and expanded access to Anthropic Claude.
Google must change AI Overviews after claiming users don't want "lots of sources."
In this post, we introduce Amazon Bedrock Ops Alert, a three-layer automated monitoring solution that proactively detects operational issues, dynamically adjusts alarm thresholds, classifies alarms by category, automati…
We build a document intelligence backend with iii by registering modular functions and reusing them across multiple triggers. The post How to Build a Document Intelligence Backend with iii Using Workers, Functions, and…
Gemma 4 12B uses a new encoding scheme and token prediction to punch above its weight.
Dreambeans is a curated list of AI-illustrated "stories" culled from the personal data in your Google account.
Critics say Trump plan to test AI models is short-sighted, performative.
Spencer Huang, Nvidia’s robotics lead, tells WIRED that the new bot combines the best of both worlds.
In this post, we show you how to get started with NEXUS on Amazon SageMaker JumpStart, walk through the deployment process, and demonstrate how to run predictions against your enterprise datasets.
This week we've got tandem hands-ons with Google's new Gemini AI agent - Spark - from my colleagues David Pierce and Jay Peters. Their takeaways are similar: It's so effective that it's scary. Spark knew that David's do…
In this post, we look at how to use SOCI on publicly available Deep Learning AMIs and Containers, when to use the various SOCI modes provided by the tool, and how to quickly and efficiently use this tool in your workloa…
Amazon's updated search bar will now show you AI-generated images of products as you describe them. For now, the in-app feature only surfaces AI images of clothing and home goods, allowing you to tap on the image that b…
In this post, you learn how to use Supervised Fine-Tuning (SFT) and Direct Preference Optimization (DPO) together to improve the tool-calling accuracy of a small language model (SLM). The example uses Amazon SageMaker A…
Amazon will use visual search and AI to show AI-generated product images that match your search queries. The retailer says it will help guide users to products.
What makes a robot gripper useful isn’t that it can pick up one object — it’s that it can pick up the next one, and the one after that, with a tool it’s never held before. What makes an autonomous vehicle system safe is…
At CVPR, NVIDIA is unveiling new physical AI agent skills that help researchers and developers speed the development of autonomous vehicles, robots and vision AI systems. The core challenge in physical AI research isn’t…
Doubts linger over whether Meta can close the gap with rivals.
GPT-Rosalind advances life sciences research with enhanced biological reasoning, medicinal chemistry expertise, genomics analysis, and experimental workflow capabilities.
Uncover second-hand scores with AI tools in Google Search and Shopping.
Direct Preference Optimization Beyond Chatbots
<p><strong><a href="https://www.bloomberg.com/news/articles/2026-06-02/uber-caps-usage-of-ai-tools-like-claude-code-to-cut-costs">Uber Caps Usage of AI Tools Like Claude Code to Manage Costs</a></strong></p> I wrote <a…
See how Wasmer used Codex with GPT-5.5 to build a Node.js runtime for the edge, accelerating development 10x to 20x and shipping in weeks instead of months.
Hermes Desktop is a no-terminal GUI sharing one agent core, skills, and memory with the Hermes Agent CLI. The post Nous Research Releases Hermes Desktop: A Native Cross-Platform Front End for Hermes Agent v0.15.2 with S…
NVIDIA released Cosmos 3, open omnimodal world models pairing an autoregressive VLM reasoner with a diffusion generator for physical AI. The post NVIDIA Releases Cosmos 3: A Two-Tower Mixture-of-Transformers Foundation…
Adding MCP Tools to Reachy Mini
<p>Microsoft <a href="https://microsoft.ai/news/building-a-hillclimbing-machine-launching-seven-new-mai-models/">announced two new text LLMs</a> this morning - <strong><a href="https://microsoft.ai/news/introducing-mai-…
Accelerated computing has revolutionized industrial engineering, compressing simulation times from weeks to hours. Today’s remaining challenges sit in the end-to-end workflow surrounding the simulations: computer-aided…
Microsoft missed the boat on apps, so get ready for agents.
<p><strong>Release:</strong> <a href="https://github.com/datasette/datasette-agent-micropython/releases/tag/0.1a0">datasette-agent-micropython 0.1a0</a></p> <p>I want <a href="https://agent.datasette.io">Datasette Agent…
<p><strong>Release:</strong> <a href="https://github.com/simonw/micropython-wasm/releases/tag/0.1a1">micropython-wasm 0.1a1</a></p> <p>Fixes for some limitations that emerged while I was trying to use this to build <cod…
The agentic AI moment has arrived, but delivering on its promise requires more than good models. It also takes fast hardware, secure runtimes, a responsive data layer and models tuned for long-running reasoning. NVIDIA…
International Mathematical Union endorses warning about tech industry influence.
<p><img src="https://static.inaturalist.org/photos/671786719/large.jpg" alt="California Brown Pelican"></p><p>California Brown Pelican, in Fort Mason, CA, US</p><p>I'm at the <a href="https://build.microsoft.com/">Micro…
Google's June Android feature drop includes more scam detection, more AirDrop, and yes, more AI.
Fine-tuning for domain-specific tasks means improving performance in one area without degrading the model’s general capabilities, and getting that balance right is harder than it looks. This post walks through how to na…
In this post, we'll walk through implementing object detection with Amazon Nova 2 Lite. You'll learn how to deploy an object detection application using Amazon Bedrock, AWS Lambda, and Amazon API Gateway. You'll also le…
This post walks through how Baz built their Spec Review agent using Amazon Bedrock and Amazon Bedrock AgentCore. We'll cover the architecture decisions, implementation details, and the business outcomes they achieved by…
Holo3.1: Fast & Local Computer Use Agents
Travelers built an AI-powered Claim Assistant with OpenAI to guide customers through filing claims, provide 24/7 support, and scale operations during peak demand.
The global health care sector is under increasing strain. Decades of chronic underinvestment and constraints in recruitment have coincided with a surge in demand for services for aging populations. Gaps in provision are…
This article is from Making AI Work, MIT Technology Review’s limited-run newsletter examining how to apply LLMs across industries. To receive it in your inbox,sign up here. From accounting to design to market research a…
Financial institutions have spent years building AI: fraud models, credit models, recommendation engines and risk systems. While this sprawl of task-specific models has been effective, it’s also constrained by siloed sy…
<p><strong>Tool:</strong> <a href="https://tools.simonwillison.net/pasted-file-editor">Pasted File Editor</a></p> <p>I really like how you can paste a large volume of text into <a href="https://claude.ail">claude.ai</a>…
Agentic AI is getting physical. At COMPUTEX on Tuesday, NVIDIA announced NVIDIA JetPack 7.2 and NVIDIA NemoClaw support on NVIDIA Jetson. JetPack 7.2 brings agentic AI skills, Yocto project support, NVIDIA CUDA 13 on NV…
Learn how Googlers used AI to produce Google I/O 2026.
Introducing Mellum2: A 12B Mixture-of-Experts Model by JetBrains
Beyond LLMs: Why Scalable Enterprise AI Adoption Depends on Agent Logic
An updated agentic model improves multi-step tool use and reliability on long tasks, a focus area as agent workloads move toward production.
We used Google AI Studio to vibe code a quiz about our top I/O 2026 announcements.
Watch 9 videos showing the capabilities of Gemini Omni and Gemini 3.5, announced at Google I/O 2026.
University of Waterloo students develop AI prototypes like sign language tutors to reshape the future of education and work.
Here are 12 of the biggest Google I/O 2026 keynote moments, including news about Gemini Omni, Gemini 3.5 Flash and more.
It is one thing to say AI will change the world. It is another to expect the class of 2026 to applaud it. In fact, when former Google CEO Eric Schmidt told University of Arizona graduates that their task is to help shap…
Amid rapidly growing adoption of enterprise-level AI agents, there’s a disconnect emerging between ambition and execution. Although 85% of organizations say they want to be agentic within the next three years, 76% say t…
Artificial intelligence has not so far produced a clean story of mass unemployment. Aggregate employment in developed countries remains broadly stable, and recent assessments have found limited evidence that AI has shif…
Haven’t you heard? White-collar jobs are going away, decimated by AI. Waves of layoffs in the tech sector (most recently at Coinbase and Meta and Cisco) are said to presage what will soon come for all of us knowledge wo…
A recap of the 2026 I/O Dialogues, where leaders discuss the future of AI, quantum computing, robotics and creativity.
For a quarter century, the Google search box has been one of the most recognizable interfaces in computing: a thin white rectangle, a blinking cursor, a few typed words, and a list of blue links. On Tuesday, Google will…
Biologists use Co-Scientist to find novel factors that successfully rejuvenate human cells.
We’re expanding access to Google AI Ultra subscribers globally and introducing a new capability powered by Street View.
A collection of science tools and experiments to expand the scale and precision of scientific exploration.
We're expanding our tools to help you understand how content was created and edited across the web.
Google DeepMind and Singapore partner to apply frontier AI to address complex challenges across health, education, and sustainability and more.
.apr-fig { text-align: center; margin: 1.35em 0; line-height: 1.4; } .apr-fig--wide img { display: inline-block; width: 100%; max-width: 100%; height: auto; vertical-align: middle; } .apr-fig--wide-0-8 { max-width: 80%;…
.grasp-results-table table { font-size: 0.875rem; line-height: 1.35; width: 100%; } .grasp-results-table th, .grasp-results-table td { padding: 0.35rem 0.5rem; } /* Consistent whitespace between major sections (this pos…
--> Understanding the behavior of complex machine learning systems, particularly Large Language Models (LLMs), is a critical challenge in modern artificial intelligence. Interpretability research aims to make the decisi…
Salesforce on Tuesday launched an entirely rebuilt version of Slackbot, the company's workplace assistant, transforming it from a simple notification tool into what executives describe as a fully powered AI agent capabl…
An encoder (optical system) maps objects to noiseless images, which noise corrupts into measurements. Our information estimator uses only these noisy measurements and a noise model to quantify how well measurements dist…
In this post, I’ll introduce a reinforcement learning (RL) algorithm based on an “alternative” paradigm: divide and conquer. Unlike traditional methods, this algorithm is not based on temporal difference (TD) learning (…
What exactly does word2vec learn, and how? Answering this question amounts to understanding representation learning in a minimal yet interesting language modeling task. Despite the fact that word2vec is a well-known pre…
.modal { display: none; position: fixed; z-index: 9999; padding-top: 50px; left: 0; top: 0; width: 100%; height: 100%; overflow: auto; background-color: rgba(0,0,0,0.9); } .modal-content { margin: auto; display: block;…
Recent advances in Large Language Models (LLMs) enable exciting LLM-integrated applications. However, as LLMs have improved, so have the attacks against them. Prompt injection attack is listed as the #1 threat by OWASP…
요약은 정보 제공 목적으로만 집계되었습니다. 전체 내용을 보려면 소스 링크를 따르세요. 데모 항목은 예시입니다.