DeepMostInnovations
/

sales-conversion-model-reinf-learning

Reinforcement Learning

stable-baselines3

sales_conversion_rl

conversation-analysis

conversion-prediction

turn-by-turn-analysis

Model card Files Files and versions

DeepMostInnovations commited on May 11, 2025

Commit

527c66c

·

verified ·

1 Parent(s): 2d58934

Update README.md

Files changed (1) hide show

README.md +6 -6

README.md CHANGED Viewed

@@ -41,7 +41,7 @@ This is a reinforcement learning model trained to predict real-time sales conver
 - **Framework**: Stable Baselines3 (PPO)
 - **State Representation**: Azure OpenAI embeddings
 - **Action Space**: Continuous (conversion probability 0-1)
-- **Feature Extractor**: Custom CNN layers
 ## Quick Start
@@ -83,12 +83,12 @@ model_path = hf_hub_download(
 # Check for GPU
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-# Custom CNN class
-class CustomCNN(BaseFeaturesExtractor):
     def __init__(self, observation_space, features_dim: int = 64):
         super().__init__(observation_space, features_dim)
         n_input_channels = observation_space.shape[0]
-        self.cnn = nn.Sequential(
             nn.Linear(n_input_channels, 512),
             nn.ReLU(),
             nn.Linear(512, 256),
@@ -98,7 +98,7 @@ class CustomCNN(BaseFeaturesExtractor):
         ).to(device)
     def forward(self, observations: torch.Tensor) -> torch.Tensor:
-        return self.cnn(observations)
 @dataclass
 class SalesAgent:
@@ -112,7 +112,7 @@ class SalesAgent:
         policy_kwargs = dict(
             activation_fn=nn.ReLU,
             net_arch=[dict(pi=[128, 64], vf=[128, 64])],
-            features_extractor_class=CustomCNN,
             features_extractor_kwargs=dict(features_dim=64)
         )

 - **Framework**: Stable Baselines3 (PPO)
 - **State Representation**: Azure OpenAI embeddings
 - **Action Space**: Continuous (conversion probability 0-1)
+- **Feature Extractor**: Custom Linear layers
 ## Quick Start
 # Check for GPU
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+# Custom Linear Layer class
+class CustomLN(BaseFeaturesExtractor):
     def __init__(self, observation_space, features_dim: int = 64):
         super().__init__(observation_space, features_dim)
         n_input_channels = observation_space.shape[0]
+        self.ln = nn.Sequential(
             nn.Linear(n_input_channels, 512),
             nn.ReLU(),
             nn.Linear(512, 256),
         ).to(device)
     def forward(self, observations: torch.Tensor) -> torch.Tensor:
+        return self.ln(observations)
 @dataclass
 class SalesAgent:
         policy_kwargs = dict(
             activation_fn=nn.ReLU,
             net_arch=[dict(pi=[128, 64], vf=[128, 64])],
+            features_extractor_class=CustomLN,
             features_extractor_kwargs=dict(features_dim=64)
         )