A.一種用于優(yōu)化策略的方法
B.一種用于計(jì)算狀態(tài)值的方法
C.一種用于選擇動(dòng)作的規(guī)則
D.一種用于表示環(huán)境模型的數(shù)據(jù)結(jié)構(gòu)
您可能感興趣的試卷
你可能感興趣的試題
A.智能體可以隨時(shí)選擇任何動(dòng)作
B.環(huán)境的動(dòng)態(tài)會(huì)隨時(shí)間改變
C.下一個(gè)狀態(tài)只取決于當(dāng)前狀態(tài)和采取的動(dòng)作
D.智能體可以看到完整的狀態(tài)空間
A.圖像與圖像疊加
B.樣本與樣本疊加
C.特征與特征疊加
D.標(biāo)簽與標(biāo)簽疊加
A.監(jiān)督學(xué)習(xí)
B.無(wú)監(jiān)督學(xué)習(xí)
C.半監(jiān)督學(xué)習(xí)
D.策略梯度
A.InceptionV3
B.Word2Vec
C.GRU
D.ARIMA
A.損失函數(shù)
B.神經(jīng)網(wǎng)絡(luò)層
C.優(yōu)化器
D.激活函數(shù)和其他非層操作
最新試題
在自然語(yǔ)言處理中,哪些方法可以用于提升自動(dòng)文本摘要的生成效果()?
反向傳播算法的主要目的是什么()?
在自然語(yǔ)言處理中,哪些技術(shù)適用于提升問(wèn)答系統(tǒng)的性能()?
人工智能發(fā)展的早期階段主要側(cè)重于哪方面的研究()?
人工智能中的“序列到序列”模型主要用于處理什么類型的數(shù)據(jù)()?
在深度學(xué)習(xí)中,哪些技術(shù)可以用于加速模型訓(xùn)練并提高模型在圖像分類和文本處理任務(wù)上的精確度()?
反向傳播算法和梯度下降算法在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的主要區(qū)別是什么()?
在神經(jīng)網(wǎng)絡(luò)中,激活函數(shù)ReLU 的特點(diǎn)是什么()?
度量泛化能力的好壞,最直觀的表現(xiàn)就是模型的()。
在深度學(xué)習(xí)中,哪些方法可以用于優(yōu)化模型訓(xùn)練過(guò)程并提高模型在特定任務(wù)上的表現(xiàn)()?