偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

基于Gym Anytrading 的強(qiáng)化學(xué)習(xí)簡單實例

作者：Kabila MD Musa 2023-07-20 15:18:42

人工智能機(jī)器學(xué)習(xí)

近年來強(qiáng)化學(xué)習(xí)(RL)在算法交易領(lǐng)域受到了極大的關(guān)注。強(qiáng)化學(xué)習(xí)算法從經(jīng)驗中學(xué)習(xí)并基于獎勵優(yōu)化行動使其非常適合交易機(jī)器人。在這篇文章，我們將簡單介紹如何使用Gym Anytrading環(huán)境和GME (GameStop Corp.)交易數(shù)據(jù)集構(gòu)建一個基于強(qiáng)化學(xué)習(xí)的交易機(jī)器人。

近年來強(qiáng)化學(xué)習(xí)(RL)在算法交易領(lǐng)域受到了極大的關(guān)注。強(qiáng)化學(xué)習(xí)算法從經(jīng)驗中學(xué)習(xí)并基于獎勵優(yōu)化行動使其非常適合交易機(jī)器人。在這篇文章，我們將簡單介紹如何使用Gym Anytrading環(huán)境和GME (GameStop Corp.)交易數(shù)據(jù)集構(gòu)建一個基于強(qiáng)化學(xué)習(xí)的交易機(jī)器人。

強(qiáng)化學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個子領(lǐng)域，涉及代理學(xué)習(xí)與環(huán)境交互以實現(xiàn)特定目標(biāo)。代理在環(huán)境中采取行動，接收獎勵形式的反饋，并學(xué)會隨著時間的推移最大化累積獎勵。代理的目標(biāo)是發(fā)現(xiàn)一個將狀態(tài)映射到行動的最優(yōu)策略，從而導(dǎo)致最好的可能結(jié)果。

Gym Anytrading

Gym Anytrading是一個建立在OpenAI Gym之上的開源庫，它提供了一系列金融交易環(huán)境。它允許我們模擬各種交易場景，并使用RL算法測試不同的交易策略。

安裝依賴

將使用的主要庫是TensorFlow, stable-baselines3和Gym Anytrading。運(yùn)行以下代碼來安裝所需的依賴項:

!pip install tensorflow 
 !pip install stable_baselines3 
 !pip install gym
 !pip install gym-anytrading 
 !pip install tensorflow-gpu

導(dǎo)入庫

導(dǎo)入必要的庫和設(shè)置環(huán)境開始:

# Gym stuff
 import gym
 import gym_anytrading
 
 # Stable baselines - RL stuff
 from stable_baselines3.common.vec_env import DummyVecEnv
 from stable_baselines3 import A2C
 
 # Processing libraries
 import numpy as np
 import pandas as pd
 from matplotlib import pyplot as plt

加載GME交易數(shù)據(jù)

將使用GameStop Corp. (GME)的歷史交易數(shù)據(jù)作為示例。我們假設(shè)您擁有CSV格式的GME交易數(shù)據(jù)，沒有的話可以通過搜索引擎找到下載地址。

加載GME交易數(shù)據(jù)并為Gym Anytrading環(huán)境做準(zhǔn)備:

# Load GME trading data
 df = pd.read_csv('gmedata.csv')
 
 # Convert data to datetime type
 df['Date'] = pd.to_datetime(df['Date'])
 df.dtypes
 
 # Set Date as the index
 df.set_index('Date', inplace=True)
 df.head()

通過Gym創(chuàng)建交易環(huán)境

下一步就是使用Gym Anytrading創(chuàng)建交易環(huán)境。環(huán)境將代表GME交易數(shù)據(jù)，我們的代理將通過購買、出售和持有股票等行為與環(huán)境進(jìn)行交互。

# Create the environment
 env = gym.make('stocks-v0', df=df, frame_bound=(5, 100), window_size=5)
 
 # View environment features
 env.signal_features
 
 # View environment prices
 env.prices

探索環(huán)境

在繼續(xù)構(gòu)建RL模型之前，可以先對環(huán)境可視化了解其特征。

# Explore the environment
 env.action_space
 
 state = env.reset()
 while True:
    action = env.action_space.sample()
    n_state, reward, done, info = env.step(action)
    if done:
        print("info", info)
        break
 
 plt.figure(figsize=(15, 6))
 plt.cla()
 env.render_all()
 plt.show()

該圖顯示了GME交易數(shù)據(jù)的一部分，以及Gym Anytrading環(huán)境生成的買入和賣出信號。

構(gòu)建強(qiáng)化學(xué)習(xí)模型

我們將使用stable-baselines3庫構(gòu)建RL模型。我們將使用A2C(Advantage Actor-Critic)算法

# Creating our dummy vectorizing environment
 env_maker = lambda: gym.make('stocks-v0', df=df, frame_bound=(5, 100), window_size=5)
 env = DummyVecEnv([env_maker])
 
 # Initializing and training the A2C model
 model = A2C('MlpPolicy', env, verbose=1)
 model.learn(total_timesteps=1000000)

評估模型

在訓(xùn)練模型之后，可以評估它在GME交易數(shù)據(jù)的不同部分上的表現(xiàn)。

# Create a new environment for evaluation
 env = gym.make('stocks-v0', df=df, frame_bound=(90, 110), window_size=5)
 obs = env.reset()
 while True:
    obs = obs[np.newaxis, ...]
    action, _states = model.predict(obs)
    obs, rewards, done, info = env.step(action)
    if done:
        print("info", info)
        break
 
 plt.figure(figsize=(15, 6))
 plt.cla()
 env.render_all()
 plt.show()

總結(jié)

在這篇文章中，我們介紹了如何使用Gym Anytrading環(huán)境和stable-baselines3庫來構(gòu)建一個基于強(qiáng)化學(xué)習(xí)的交易機(jī)器人。本文只是一個起點，構(gòu)建一個成功的交易機(jī)器人需要仔細(xì)考慮各種因素并不斷改進(jìn)。

責(zé)任編輯：華軒來源： DeepHub IMBA

強(qiáng)化學(xué)習(xí)機(jī)器學(xué)習(xí)

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<ruby id="1x7go"></ruby>

<sup id="1x7go"></sup>

<wbr id="1x7go"><fieldset id="1x7go"></fieldset></wbr>

<center id="1x7go"></center>