快速提取音视频内容,整理成一份结构化的markdown笔记
最近更新:
9天前
使用AI大模型,一键生成高清故事短视频。Generate high-definition story short videos with one click using AI large models.
最近更新:
9天前
AppAgent: Multimodal Agents as Smartphone Users, an LLM-based multimodal agent framework designed to operate smartphone apps.
最近更新:
9天前
SEED-Story: Multimodal Long Story Generation with Large Language Model
最近更新:
9天前
Official implementation of AppAgentX: Evolving GUI Agents as Proficient Smartphone Users
最近更新:
9天前
PPTAgent: Generating and Evaluating Presentations Beyond Text-to-Slides: https://arxiv.org/abs/2501.03936
最近更新:
9天前
Intelligence framework in python for your product like Apple Intelligence
最近更新:
9天前
百聆 是一个类似GPT-4o的语音对话机器人,通过ASR+LLM+TTS实现,时延低至800ms,低配置也可运行,支持打断
最近更新:
9天前
Windows版本微信客户端(非网页版)自动化,可实现简单的发送、接收微信消息,简单微信机器人
最近更新:
9天前
AgentCPM-GUI: An on-device GUI agent for operating Android apps, enhancing reasoning ability with reinforcement fine-tuning for efficient task exec...
最近更新:
9天前
AI 视频笔记生成工具 让 AI 为你的视频做笔记
最近更新:
9天前
The Intelligent GUI Agent for Mobile Phones
最近更新:
9天前
适用于微信客户端4.0版本的wxauto
最近更新:
9天前
An Open Phone Agent Model & Framework. Unlocking the AI Phone for Everyone
最近更新:
9天前
Pioneering Automated GUI Interaction with Native Agents
最近更新:
9天前
RikkaHub is an Android APP that supports for multiple LLM providers.
最近更新:
9天前
AutoGLM 的现代化 Web 图形界面 - 让 AI 自动化操作 Android 设备变得简单
最近更新:
9天前
AI-Powered Python & Python-Powered AI (Python-Use)
最近更新:
9天前
基于Android原生AccessibilityService的微信私域自动化工具,支持通讯录同步、AI智能私信等功能。完全独立运行,无需电脑连接。
最近更新:
9天前
仍然可用的微信RPA!支持4.0系列微信pywechat是一个基于pywinauto实现的windows桌面微信自动化操作工具,基本实现了PC微信内置的各项操作。
最近更新:
9天前