谷歌正式推出Gemini 1.5 Pro 能夠理解音頻支持系統(tǒng)指令/JSON模式 – 藍(lán)點(diǎn)網(wǎng)
兩個(gè)月前谷歌在 Google Ai Studio 中提供了 Gemini 下一代版本 Gemini 1.5 Pro 供部分開發(fā)者測試,谷歌夠理該模型具有 1M 上下文窗口并且具有原生的正式音頻理解能力。
谷歌今天宣布 Gemini 1.5 Pro 模型在全球 180 多個(gè)國家或地區(qū)推出,推出統(tǒng)北京朝陽(上門全套服務(wù))上門服務(wù)vx《192-1819-1410》提供外圍女上門服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)正式上線后該模型還推出了系統(tǒng)指令和 JSON 等新功能,解音讓開發(fā)者可以更好地控制模型的頻支輸出。
此次谷歌還推出了下一代文本嵌入模型,持系其性能由于同類模型,式藍(lán)開發(fā)者可以通過 Google Ai Studio 創(chuàng)建和訪問 API 密鑰然后調(diào)用該模型進(jìn)行構(gòu)建。點(diǎn)網(wǎng)

音頻和視頻模式解鎖新用例:
谷歌擴(kuò)展了 Gemini 1.5 Pro 的谷歌夠理輸入模式,包括 Gemini API 和 Google Ai Studio 中的正式北京朝陽(上門全套服務(wù))上門服務(wù)vx《192-1819-1410》提供外圍女上門服務(wù)快速選照片快速安排不收定金面到付款30分鐘可到達(dá)音頻理解,同時(shí)該模型還能夠?qū)ι蟼鞯耐瞥鼋y(tǒng)視頻圖像 (幀) 和音頻 (語音) 進(jìn)行推理,谷歌很快會(huì)為此添加 API 支持。解音
新增的頻支系統(tǒng)指令功能:
使用系統(tǒng)指令可以指導(dǎo)模型的響應(yīng),現(xiàn)在在 Google Ai Studio 和 Gemini API 中提供,持系開發(fā)者可以定義角色、式藍(lán)格式、目標(biāo)和規(guī)則,針對特定用例對模型進(jìn)行引導(dǎo)。
JSON 模式:
只是模型僅輸出為 JSON 對象,此模式可以從文本或圖像中提取結(jié)構(gòu)化數(shù)據(jù),開發(fā)者可以使用 cURL,后續(xù)將支持 Python SDK。
函數(shù)調(diào)用的改進(jìn):
開發(fā)者現(xiàn)在可以選擇模式來限制模型的輸出,從而提高可靠性。選擇文本、函數(shù)調(diào)用或僅函數(shù)本身等。
性能改進(jìn)的新嵌入式模型:
從今天起開發(fā)者可以通過 Gemini API 訪問下一代文本嵌入模型 text-embedding-004/text-embedding-preview-0409。
谷歌稱其在 MTEB 基準(zhǔn)測試中實(shí)現(xiàn)了更強(qiáng)的檢索新年,并且由于具有可對比緯度的現(xiàn)有模型。
有關(guān)以上內(nèi)容可訪問谷歌官方博客查看資源鏈接:https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html









