0 |
需求描述 |
我的目前解法和問題 |
我有工具推薦可解 |
微信里的對話、內(nèi)容或鏈接,總結摘要 |
轉(zhuǎn)發(fā)出去就返回一個摘要 |
1 目前需要自己復制粘貼內(nèi)容給GPT |
|
AI 音視頻管理工具 |
管理本地的音視頻文件,音視頻文件轉(zhuǎn)錄成文字,基于轉(zhuǎn)錄結果生成內(nèi)容摘要,生成播客 Show Notes,視頻文件生成字幕。 |
目前基于 Open AI 的 Whisper 模型做了一個初期的版本已經(jīng)上架了。https://apps.apple.com/app/audio-podium/id6449008295 |
https://tingwu.aliyun.com/ |
Twitter timeline自動翻譯 |
不用點進去Twitter里面就能自動英文翻譯 |
沉浸式翻譯完美解決: https://immersive-translate.owenyoung.com/ |
|
和網(wǎng)頁對話 |
目前需要自己復制粘貼內(nèi)容給GPT |
1. Edge瀏覽器的必應GPT |
|
自動編曲 |
哼唱一段旋律,自動生成完整的曲子,加上歌詞變成一首歌 |
ace studio 有但還未開放 |
暫無 |
youtube沒有字幕的視頻加上實時字幕 |
youtube沒有字幕的視頻加上實時字幕 |
目前沒有看到產(chǎn)品 |
https://www.engineerdraft.com/bemyears |
快速閱讀PDF論文 |
對PDF格式的文件可解析并閱讀,提煉重點 |
Chatdoc/ChatPDF。經(jīng)常胡說八道,總結抓不到重點。 |
通過vercel一鍵部署一個PDF+GPT到自己網(wǎng)站 |
英語口語練習 |
一個AI私人英語學習教練,最好是非常真實的虛擬人,每天提醒我學英語,交流討論特定場景問題。了解我的能力水平,能糾正我的發(fā)音,有明確的學習線路和激勵反饋。 |
1. Callannie體驗很好,但過于開放,不知道聊什么,也不是專門練習口語而做。缺乏類似多鄰國的學習線路和激勵反饋; |
Callannie,Trancy,Speak Read、myshell、多說、speakG(小程序) |
長文章摘要總結 |
現(xiàn)在的文章摘要工具可總結內(nèi)容太短,而且抓不到重點;最好能有可調(diào)節(jié)總結顆粒度的工具 |
Glarity等摘要工具,但是太長的會自動丟掉,分段總結合并也會失真。等不到32k API而且價格貴,希望有更好的解決方案 |
Glarity, Monica |
無障礙跟老外打字溝通 |
讀翻譯后的非中文Twitter,想評論但語言不通,想用中文評論,自動翻譯成對應的語言發(fā)出去。 |
手機上用OpenCat,設定對應語言翻譯Prompt,切換鍵盤點擊Prompt翻譯發(fā)送。 |
OpenCat |
面向老人的聊天機器人 |
我母親年齡大了以后眼鏡近乎失明,沒有了以前的社交圈,幾乎都在家待著。缺少一個日常聊天的伴。 |
我先后買過喜馬拉雅和小米的智能音響,但是互動的效果還是不好,基本就是用來搜歌和小說聽 |
我做了針對小孩的,短視頻演示地址:6.15 Zzg:/ 復制打開抖音,看看【任亞軍的作品】自制一個智能音響,給小朋友做陪伴助理。# chat… https://v.douyin.com/U1w4geV/ |
畫一個草圖,生成頁面 |
草圖也可以不用那么草,主要是提高產(chǎn)品原型的制作效率 |
國內(nèi)設計產(chǎn)品:“即時設計”。最近全面開放了AI創(chuàng)作,可根據(jù)prompt生成產(chǎn)品設計稿并進行切圖和標注,目前只支持設計移動端的產(chǎn)品原型 |
1. 即時設計https://js.design/ai-upcoming 2. Galileo.ai |
智能記賬本 |
自然語言交互,自動識別關鍵信息記賬,智能分類 |
手動輸入金額,選擇日期分類,填寫備注 |
挖財記賬可以語音輸入,但是識別不準 |
幫助人們優(yōu)化提示詞 |
期望迭代一種提示詞 |
已解決,使用LangGPT |
https://app.copilothub.ai/chat?id=3733 |
抓取指定信息,展示閱讀 |
根據(jù)信息源(網(wǎng)址,RSS,Twitter,微信群等),或者自定義關鍵詞(關鍵詞,標簽),推送指定最新信息,可根據(jù)指定形式篩選(篩選:時效性,專業(yè)度) |
目前是用feedly |
小程序:FocusRead |
閱讀論文pdf(輔助性) |
論點從上到下的翻譯和總結 |
圖表數(shù)據(jù)閱讀和整理不是很好 |
chatPaper |
AI輸入法鍵盤 |
AI輸入法,可以內(nèi)置各類Prompt和設定助手,比如多語種翻譯、AI潤色等等,將用戶的輸入進行轉(zhuǎn)換后輸出 |
目前來看輸入法集成這些很方便,opencat已經(jīng)有鍵盤拓展可以解決,但不是很原生,體驗有割裂感 |
opencat |
結對編程 |
幫助程序員完善代碼,自動生成一些簡單的算法和代碼,提高編程效率 |
對初級程序員更有用,一般程序員都是老帶新,而且不同行業(yè)的技術棧差異很大 |
https://github.com/features/copilot |
文本【不限題材】拆解工具 |
根據(jù)提示詞和自然語言拆解要求,能將輸入的文本按照要求進行信息捕捉和拆解歸納 |
1.利用GPT4提問的方式,根據(jù)使用者提出的要求、prompt和提供的樣稿進行拆解; |
暫無 |
商品購買建議 |
GPT-3 + web 插件 + 特定prompt。不建議開發(fā),因為強需求,平臺會做。 |
GPT-4 + web 插件 + 特定prompt。不建議開發(fā),因為強需求,平臺會做。 |
Aiffler,目前基于消費者真實體驗,幫助消費者生成評論和賣家收集評論。中期準備做以真實評價為出發(fā)點的第三方點評和種草平臺。主要面向海外市場 |
群聊總結機器人 |
群里聊天記錄爆炸,一個一個翻較麻煩,需要一個總結群聊關鍵信息的 gpt |
1 爬取群里內(nèi)容,扔給 GPT 做總結 |
https://open-gpt.app/app/clf0yo8ns0002l708071smz8m |
自動競品分析 |
指定產(chǎn)品,自動抓取data.ai等統(tǒng)計分析工具中的下載量、DAU等數(shù)據(jù),抓取官網(wǎng)產(chǎn)品介紹、新聞報道等,生成對比表格 |
目前靠人工手動收集整理 |
|
可視化學習 |
給出一個名詞關鍵詞,自動生成圖片甚至是3D畫面,每個組成都有標注,可以點擊探索學習,幫助孩子學英語和其他知識 |
???? |
https://www.engineerdraft.com/hanzigraph/ |
上傳一個文檔(word/pdf),用GPT翻譯,生成新的文檔 |
就是一般理解的翻譯文檔,保持原格式 |
沉浸式翻譯。只能雙語對照,并且不是所有文檔都能翻譯 |
calibre里面的翻譯書籍插件 |
針對于設計師模擬文案提效工具 |
相比于GPT,內(nèi)置常用文案模版,例如新聞評論(20字),留言(10字),個人簡歷(50字)等。還可以生成特殊格式,例如XBK+148273+(0-1000)排序的數(shù)據(jù);中英文結合數(shù)據(jù),前面如何,后面如何這種。根據(jù)業(yè)務不同可以生成比較真實的數(shù)據(jù),減少設計師文案黑洞。 |
暫無!figma插件 Content Reel 可提前編輯內(nèi)容,填充假數(shù)據(jù)。但是源數(shù)據(jù)還需手動創(chuàng)建。 |
|
總結所有文章 |
總結我正在看的文章,并輸出關鍵結論 |
需要復制鏈接發(fā)給gpt-4 或者使用 Newbing的副駕駛,對于國內(nèi)來講,很麻煩。 |
考慮Glasp?收藏高亮的同時收藏文章。養(yǎng)熟了之后是不是可以根據(jù)高亮輸出結論? |
用自己的聲音給孩子朗讀自己編的故事 |
用eleven的語音合成+ChatGPT生成故事,自動生成故事朗讀,可以和上面的繪本組合就更好了 |
目前都需要自己搞,流程復雜 |
、 |
親人留念機 |
很多人對逝去的親人懷念,會聽遺留下來的語音,看留下來的視頻照片 |
這個日本好像有了 |
我們做的靈魂刻錄機快上線了: |
做個人人都能用的編程器 |
目前大部分編程都是用GPT4,Copilot,希望有一款從0開始的特定編程,比如通過填寫對應的產(chǎn)品功能(目前 https://www.pm-ai.cn/ 可用,但是實際要開發(fā)還要一段時間),配置開發(fā)環(huán)境選項框(例如系統(tǒng):windows10,linux,mac),開發(fā)語言選項框(python,PHP,Java),部署生產(chǎn)環(huán)境選項框(Web應用,APP,桌面端),AI自動生成對應的工程級源碼文件(API可自配),以及部署教程 |
目前用GPT+人工 |
|
本地多語種視頻總結 |
本地電腦中下載了數(shù)小時長的課程視頻,課程所用語言含中英日等多種語言,需要梳理出內(nèi)容結構、要點。 |
暫無 |
|
長文字自動拆分后發(fā)給gpt |
超出字數(shù)限制的時候,自動分成多段發(fā)出 |
目前是自己憑感覺拆 |
langchain 好像支持的 |
簡單化的自制繪本 |
把ChatGPT生成的故事,自動生成風格一致的繪本。 |
目前的制作流程太復雜了,一般人用不起來 |
https://www.storywizard.ai/ |
私域CRM機器人 |
爬取用戶聊天記錄和朋友圈,訂單信息(電商平臺有api)針對用戶特征進行個性化回復。 |
目前沒見到類似產(chǎn)品 |
https://dify.ai/zh |
定制化香水 |
根據(jù)不同女性的數(shù)據(jù)特征,用AI模型生成特定的香型 |
需要收集大量女性特征數(shù)據(jù)和偏好香型 |
|
保持一個gpt的永久記憶力 |
一個對話可以永續(xù)帶有最關鍵的信息聊下去,比如模擬某個人或者職業(yè)身份,或者帶有翻譯之類的任務 |
隔一段時間重復一下prompt |
system prompt |
AI語音識別提詞器 |
可以識別講話的內(nèi)容,自動對應文稿內(nèi)容,實現(xiàn)自動翻頁等功能 |
國外有能識別英文的提詞器軟件,國內(nèi)鮮有相關軟件,有也做得效果不好 |
|
AIGC Digg平臺 |
做一個國內(nèi)的AIGC digg類工具,自動抓取AI新聞翻譯+GPT初篩,人肉點贊,點踩篩選出當天最重要10條資訊 |
暫未看到 |
Scrapy—-爬取今日頭條前十條新聞 |
法律鑒定意見 |
需求:目前市面上沒有針對中國法的詳細的案例鑒定和分析生成工具 |
1. Embedding 法律數(shù)據(jù)庫 |
|
RSS 排序摘要 |
讀取每天的 RSS 訂閱內(nèi)容,做出摘要,按重要程度、內(nèi)容質(zhì)量和我反饋的感興趣程度排序。 |
Huginn + GPT? |
|
多語言化網(wǎng)站 |
把個人博客雙語化(中文、英文) |
自己寫中文英文 |
|
midjourney 輔助工具 |
目前midjourney生成圖片的質(zhì)量參差不齊, 生成五次可能只有2張是能用的。如果關鍵詞已經(jīng)固定, 能不能同時用多個賬號自動生成30張圖,然后我再從中挑最好的?或者引入AI對圖片的質(zhì)量進行評估,按圖片質(zhì)量好壞排序。 |
我在用midjourney生成動漫頭像,要手動生成好多次,才能挑出能用的,像抽卡一樣。還要仔細檢查手指的數(shù)量對不對。 |
我做的一款批量生圖小插件 |
心理疏導 / Life coach |
– 需求:隨著經(jīng)濟大環(huán)境變差、階級固化、內(nèi)卷加劇,大家在心理疏導上的訴求一定在不斷攀升,但除了和親友傾訴、花大錢長期找心理咨詢,沒有太好的方式。 |
有訴求的廣大群體,大多數(shù)還是通過親友溝通的方式(但很多人甚至找不到靠譜的傾訴對象),他們很難知道如何使用ChatGPT,也很難有經(jīng)濟能力負擔專業(yè)咨詢費用,更有甚者會被不道德的從業(yè)者誤導。 |
清華的聆心智能好像就在做這件事情 |
碎片化信息整合化 |
比如做一個用戶調(diào)研報告,會收集不同類型用戶的反饋信息,內(nèi)容包含:功能類,體驗類,內(nèi)容類,但很口語,同時還要結合當前產(chǎn)品和競品,最終輸出可落地的報告分析框架和結果 |
自己梳理,會使用思維導圖、表格、可視化信息圖表等等多種展示方式來呈現(xiàn)信息 |
|
電影翻譯機 |
英文原聲轉(zhuǎn)國語原聲,同時對上口型,以及同樣的音色和語氣 |
這個國內(nèi)不過審,只能生成了自己看 |
https://www.chinaz.com/2023/0511/1523397.shtml |
如何讓AI更好的處理機器輸入的傳感器數(shù)據(jù)(SLAM,Eyetracking,頭部IMU,Mic等),達到比用戶自己更了解用戶的效果 |
– AI能夠處理大量的,混沌的,先前方法效率和性價比很低的數(shù)據(jù),這些數(shù)據(jù)相當于是人的數(shù)字版,能夠處理這些數(shù)據(jù)相當于能夠構建一個比用戶自己更了解用戶的AI; |
研究SAM和Imagebind,但都還沒找到裁剪和應用的方法 |
Imagebind |
書籍拆解 |
比如說,我看到一本電子書,想要把書本中重點以及段落概要輸出,最后匯總成一篇完整的書籍解析。 |
暫未發(fā)現(xiàn)有好用的軟件,識別不準確,生成結果不理想 |
同類里chatdoc好一些,但也沒那么精準:https://chatdoc.com/ |
自媒體賬號矩陣系統(tǒng) |
開發(fā)自媒體賬號矩陣系統(tǒng),利用GPT自動抓取最新榜單和熱點 |
正在開發(fā)中 |
|
類似lingq且融入ai的英語閱讀應用 |
融合類似微信讀書的批注功能,lingq的可視化功能和ai問答為一體的應用 |
||
醫(yī)學數(shù)據(jù)核查+編碼 |
臨床藥物研究,對病癥做科學描述(以meddra編碼為例,比如拉肚子的編碼為10027482,學名腹瀉”(Diarrhoea))。另外想通過AI做病歷核查,比如通過 體重 + 年齡 白細胞等多個檢查項目校驗癌細胞指標測量結果,讓各個指標能互相校驗 |
目前在臨床研究領域需要由專業(yè)人員(CRC、DBD)手動編寫邏輯表達式,效率很低 |
rave edc |
運營+文科研究用爬蟲+數(shù)據(jù)分析器 |
填入API和篩選條件自動抓取Twitter,Youtube等平臺信息。比如“競品Twitter本周最火的一條帖子。Youtube上面向歐洲市場三萬粉以上的youtuber”。抓取后自動生成表格或發(fā)送到郵箱 |
1. 用agentgpt分解問題,直接有答案的直接用。給出代碼的搬到python上跑。技術門外漢經(jīng)常遇到代碼報錯,安裝不上庫的問題。 |
|
在手機上運行語言模型 |
有些信息只能在本機調(diào)用,力量不用很強。 |
iPhone上有MLCChat,一運行就發(fā)熱死機,pixel 7上期望能用上,更自由一些。 |
|
給孩子取名字 |
對接chatGPT或者其他大語言模型,用戶輸入孩子姓氏、性別、取名字的要求,AI給出名字建議。 |
提前設計好幾個不同的prompt模板風格 |
取名軟件有https://tool.lu/naming/ |
歷史學習輔助 |
需求demo:中國史、世界史的文獻和專業(yè)書籍內(nèi)容可以按照年代、國家、人物定位到結構化信息內(nèi)容。 |
1. 信息抽?。菏褂么罅繉I(yè)內(nèi)容訓練 |
|
電商單品推薦 |
假設數(shù)據(jù)樣本足夠,是不是可以根據(jù)同類身材類型做品類sku的推薦 |
沒有解法,全靠買回來試錯 |
可以小紅書關注同樣身材、風格的博主 |
內(nèi)部Wiki/用戶手冊改成提問查詢 |
內(nèi)部所有Wiki 和用戶手冊做成ChatBot進行查詢 |
考慮到內(nèi)部信息保護,需要私有化部署LLM模型且保證有GPT4的處理能力 |
|
找東西工具app |
耳機、眼鏡等找不到的時候,告訴手機幫我找“眼鏡”,然后拿著手機轉(zhuǎn)一圈,自動找到。 |
1. 語音交互 |
暫無 |
XR 合成虛擬人 |
結合前面的親人留念需求,以及成熟的數(shù)張相片合成生成頭像技術,進一步生成虛擬人,以及AI語音模擬本人,生成希望獲得的虛擬人進行視覺條件下對話或其他互動 |
其實目前技術都成熟,就看pico做不做,難點仍然在審核和配套的元宇宙/虛擬空間場景, MVP是單一場景下視頻對話工具 |
清華沈陽老師團隊已經(jīng)做出來了,微博搜索可見 |
寵物疾病診斷工具 |
拍幾張照片診斷一些明顯的寵物疾病。 |
||
BI看板設計和優(yōu)化 |
基于給定的脫敏數(shù)據(jù)和看板設計需求,AI生成看板設計圖。 |
人工手動設計、被他人推翻再修改。 |
|
線上試裝 |
在電商軟件買衣服,每個人的體型身高不一樣,衣服穿在身上肯定也是不一樣的,需要拍照換臉或者選擇臉型發(fā)型,輸入身高體型后,自動有相應衣服的尺碼在旁邊顯示,衣服在屏幕上顯示可3d查看,這樣能更直觀知道這個衣服穿著身上是什么樣的 |
||
AI家庭計算中心 |
1. 現(xiàn)有智能音箱的進階版,但形態(tài)和能力大幅增強,變?yōu)閯傂?br />2. 有聽說讀寫能力,比如說: |
現(xiàn)有細分領域能力的一個整合產(chǎn)品,整合的能力包括: |
|
操作系統(tǒng)自然語言編程 |
程序員寫的代碼只能滿足用戶最常用的需求,但其實用戶有很多小場景需求一直處于未滿足狀態(tài)。用戶可以下載一些三方應用來解決這些長尾需求,但是由于只有用一兩次,成本就比較高。 |
chat gpt具備短小功能的編碼能力,我們需要加強: |
|
iphone相冊整理 |
大量的截圖、視頻;工作場景、生活場景、旅游場景、收藏美圖;堆滿了我的icloud。每次想要整理,但是3w+照片整理不了幾百張就累了,下次又得重頭開始。 |
目前用2Ticloud頂著;外加時不時slidebox一下。 |
一刻相冊(百度出的) |
參考上一條想到的: |
github copilot 能幫程序員提高輸入效率,但不一定是工作效率,影響一個人工作效率的因素還包括情緒、思考、吐槽等。 |
||
做一個AI行業(yè)的技術知識庫,供大家學習和貢獻,未來可以單篇收費,反哺貢獻者,做ai技術方面的知識變現(xiàn) |
初步想法,希望有志同道合的朋友一起 |
||
按摩椅 |
想要非常接近真人按摩的按摩椅,精準定位用戶痛點解決用戶需求,雖然感覺很難但是先寫上來 |
無,希望大佬造福 |
試試奧佳華的OG8598Plus |
gpt國內(nèi)鏡像站 |
可能提到國內(nèi)鏡像站大家覺得已經(jīng)爛大街了,沒有價值了。但是這里我要說的鏡像站是指更加注重用戶體驗的鏡像站,他有APP,公眾號,PC端,瀏覽器插件四端,可以滿足不同用戶在不同場景下的使用;他有針對不同行業(yè)不同角色深度定制的prompt指令,可以滿足各行業(yè)人群的使用需求 |
目前已經(jīng)研發(fā)完成 |
國內(nèi)好像沒沒找到這么完善的,如果大家找到,可以發(fā)我一下,我們一起繼續(xù)完善 |
飛書便捷識圖 |
希望能在飛書文檔中,滿足長按幾秒或什么方式可以快速識別出圖片中的文本 |
-場景:在飛書文檔中看到一些有文字的圖片,想要轉(zhuǎn)文字的時候 |
截圖復制到微信,微信內(nèi)打開即可直接復制文本,無需通過OCR,不過也相對麻煩,省去了ORC的步驟 |
AI虛擬數(shù)字人 |
針對比如高校老師錄課場景,本地上傳一段3-5分鐘的真人講課視頻,AI提取視頻 根據(jù)文本 自動合成聲音以及虛擬數(shù)字人形象。 |