grok-collections-api RAG구축 API

grok-collections-api RAG구축 API
https://x.ai/news/grok-collections-api

Collections API를 발표하게 되어 매우 기쁩니다. Collections를 사용하면 전체 데이터 세트를 업로드하고 검색할 수 있습니다. PDF 파일과 엑셀 시트부터 전체 코드베이스까지, 파일을 정확하고 빠른 검색을 지원하는 지식 기반에 업로드할 수 있습니다. 이를 통해 개발자는 인덱싱 및 검색 인프라 관리의 번거로움 없이 RAG 애플리케이션을 구축할 수 있습니다.

처음 시작하시는 분들을 위해 파일 색인 및 저장 서비스를 첫 주* 동안 무료로 제공하며, 검색 요금은 1,000회 검색당 2.50달러의 고정 요금으로 책정됩니다.

Gemini의 이미지 펜툴로 편집 기능

4d756358-92a2-4fbe-a3d7-f64761142951-image.webp
Gemini의 이미지 펜툴로 편집 가능 – 00:57
— 봄봄스쿨

ScreenFlow.mp4
5847d61e-723b-4cf0-a23c-21d36aeed402-image.webp

1 Gemini를 활용하면 이미지 편집이 펜을 든 것처럼 직관적으로 처리할 수 있습니다. 등록한 이미지 위를 클릭하면 편집화면으로 전환되고 펜과 텍스트 툴이 나타납니다. 수정 사항을 편집 포인트로 정할 수 있고 명확한 지시를 텍스트 프롬프트로 추가제작해서 생각했던 것과 다른 상황을 최소화합니다.

2 이러한 방식은 타겟에 맞춰 상품이나 의상 등 적용해야 할 부분에 즉각적으로 변경할 수있어 비즈니스 유연성을 높여줍니다. 이제 누구나 전문적인 이미지 활용 능력을 갖출 수 있습니다.

3 복잡한 툴 없이도 가능한 이 간편함을 직접 확인해 보세요.

e8a24f4b-113b-4a68-b0b7-a6d9ab94a5fa-image.webp

시각적인 레고 설명서를 머신러닝으로 3D로 만들어주는 논문

스탠포드 대학 논문중에
https://cs.stanford.edu/~rcwang/projects/lego_manual/

https://github.com/Relento/lego_release

레고메뉴얼을 보고 그대로 만드는 프로그램 코드가 있습니다.
a44bef0c-55fd-451f-8b18-9d222f45cd81-image.webp

본 연구에서는 인간 설계자가 제작한 이미지 기반의 단계별 조립 설명서를 기계가 해석할 수 있는 지침으로 변환하는 문제를 다룹니다. 이 문제는 순차적 예측 작업으로 정식화됩니다. 각 단계에서 우리 모델은 설명서를 읽고 현재 형상에 추가될 구성 요소를 찾아 3D 자세를 추론합니다. 이 작업은 설명서 이미지와 실제 3D 객체 간의 2D-3D 대응 관계를 설정하는 것과, 새로운 구성 요소가 이전 단계에서 만들어진 객체일 수 있기 때문에 이전에 보지 못한 3D 객체에 대한 3D 자세 추정이라는 두 가지 과제를 안고 있습니다. 이러한 두 가지 과제를 해결하기 위해, 우리는 일련의 설명서 이미지로부터 조립 단계를 재구성하는 새로운 학습 기반 프레임워크인 MEPNet(Manual-to-Executable-Plan Network)을 제안합니다. 핵심 아이디어는 신경망 기반의 2D 키포인트 검출 모듈과 2D-3D 투영 알고리즘을 통합하여 높은 정확도의 예측과 이전에 보지 못한 구성 요소에 대한 강력한 일반화 성능을 구현하는 것입니다. MEPNet은 새로 수집된 세 가지 LEGO 설명서 데이터셋과 Minecraft 주택 데이터셋에서 기존 방법보다 우수한 성능을 보였습니다.

1e57e53b-76a8-4837-9415-422536a572b1-image.webp

요즘이라면 사진이나 낙서를 3D모델로 바꿔볼만 할거 같다는 생각이 드네요

레고시리어스플레이 AI 버전이 가능할거 같은 희망이 ^^

전자책 뷰어를 만들다가 아예 gnuboard->epub 편집기로

6f5b3ea5-7ac3-403e-af69-7406217cf292-image.webp

카드뉴스 마무리하다 외부 공유용 api 를 붙이고 거기 새로운 정보를 제공하는 뉴스와 이런 저런 작업을 하다 만드는 김에 뷰어를 간단히 추가했습니다. 처음에는 간단하게 시작하다가 거기에 이상한 기능을 넣고 gnuboard->epub 편집기 (실제 그누보드는 사용하지 않고 DB구조만 쓰고 있습니다.)

교정본거 텍스트 추가한거 일한걸 다 볼 수 있습니다. 일한 것을 추적하고 그림 그린 것을 원고에 다시 넣어서 AI 가 바꿔서 그림책을 만들거나 여러가지 복잡한 작업을 할 수 있습니다.

CRDT를 사용해서 누가 뭐하고 있는지 보이게는 했는데 혼자서 만들고 왼손이 오른손하고 협업합니다?

그누보드, 페이스북 백업, 네이버, 다음 등등 컨텐츠를 뽑아내서 합치는 기능외 나누는 기능도 준비중입니다.

2가지 작업에 주말 다 날렸네요 ^^
945bba74-5c5a-43ea-a728-17bacd15c42e-image.webp

노란색 그림을 동화로 그려줘 라는 간단한 프롬프트로 만들어지는 동화책
157f6924-6cc5-4be7-9c39-f396afb36553-image.webp

Yes24 카드뉴스 + 3D입체 책 생성기 제미나이API, Ollama 전용

2788ba26-e76b-4240-a932-7edee30d75da-image.webp

Yes24 카드뉴스 생성기 Ollama 전용

https://video.a1bbs.com/s/aJTtt5ySlaMUWaR

윈도우

https://video.a1bbs.com/s/IcHDnNjxH8E7yo9

Ollama Gemini API AI Yes24 도서 카드뉴스 생성기 +3D 도서 – 24:30
— 봄봄스쿨

지금 로고 만들고 맥은 컴파일 끝냈습니다. 윈도우도 금방 끝날거 같은데 이번에는 dmg, msi 같은 인스톨러를 처리해야 하는데 일단 올리고 난 다음에 진행해볼까 합니다.

Yes24 카드뉴스 생성기 버전 0.00000001

Yes24 도서 정보를 활용하여 전문적인 카드뉴스를 자동으로 생성하는 도구입니다. 다만 완성된 상품으로서가 아니라 개발 진행형 상태입니다. 출판사에 카드뉴스가 없는 페이지들을 업무 체계상 쉽게 기본 틀을 만들고 캔바, 어도비익스프레스 카드뉴스 전문 생성기, 릴스, 쇼츠같은 영상으로 전환이 가능합니다.
현재 프로그램은 Google Gemini 와 Ollama를 활용하는 기능을 채용해서 시간을 절약해줄 수 있습니다. 서점 도서 데이터베이스도 수집을 하지않고 1회성으로 필요한 정보만 가져옵니다.

도서 정보를 수집하는 기능 때문에 1회성으로 사용하는 것의 제한이 있지만 카드뉴스 만드는데는 아무 문제가 없을 것입니다. 다만 대용량으로 카드뉴스 제작하시는 분에게는 별도 문의를 해주세요.

argo9.com

주요 기능

도서 정보 수집

  • Yes24 웹사이트에서 도서 정보 자동 크롤링
  • 표지, 뒷표지, 책등 이미지 수집
  • 목차, 출판사 서평, 저자 소개 등 상세 정보 수집
  • 도서 리뷰 및 평점 정보 수집
  • 내장 데이터베이스에 체계적으로 저장

AI 기반 카드뉴스 생성

  • Google Gemini 또는 Ollama를 활용한 AI 분석
  • 도서 정보를 바탕으로 한 스토리텔링 구조 생성
  • “WHY → WHAT → WHO → WHEN → THIS SOLUTION” 스토리텔링 패턴 적용
  • 페르소나별 맞춤 콘텐츠 생성

전문적인 편집 도구

  • 텍스트 블록(제목, 부제목, 자막) 드래그 앤 드롭 편집
  • 텍스트 위치, 크기, 회전 각도 조정
  • 개별 텍스트 스타일링 (폰트 크기, 색상, 정렬)
  • 이미지 확대/축소 및 회전
  • 1페이지 스타일을 전체 카드에 일괄 적용

다양한 내보내기 옵션

  • ZIP 파일: 모든 카드 이미지 + SRT 자막 파일
  • YAML 파일: 카드뉴스 전체 데이터 (좌표, 스타일 포함)
  • CSV 파일: 카드뉴스 데이터를 스프레드시트 형식으로
  • MP4+SRT 릴스: 짧은 영상 제작을 위한 이미지와 자막 패키지

데이터 관리

  • SQLite 데이터베이스에 모든 좌표 및 스타일 정보 저장
  • YAML 기준 좌표계로 정확한 레이아웃 유지
  • 도서 정보 히스토리 추적 (가격, 할인, 리뷰 변화)
  • 카드뉴스 순서 변경 및 재정렬

사용 방법

1단계: 도서 정보 수집

  1. 생성 페이지로 이동
  2. Yes24 도서 URL 입력
  3. 도서 정보 자동 수집 및 분석

2단계: 카드뉴스 생성

  1. 페르소나 선택 (타겟 고객 설정)
  2. 카드 개수 설정
  3. 추가 컨텍스트 입력 (선택사항)
  4. AI가 자동으로 카드뉴스 생성

3단계: 편집 및 내보내기

  1. 편집
  2. 텍스트 위치, 스타일 조정
  3. 원하는 형식으로 내보내기

제작

b2c76ed8-aa3e-437e-a66d-b3a047b6242a-appicon.webp appicon.webp

제작: argo9.com