Spaces:

lucalp
/

blt-entropy-patcher

Running on Zero

par-meta commited on Feb 18

Commit

b0956bd

unverified ·

1 Parent(s): 82ab593

Make apex logs less noisy (#60)

Files changed (4) hide show

bytelatent/base_transformer.py CHANGED Viewed

@@ -1,4 +1,5 @@
 # Copyright (c) Meta Platforms, Inc. and affiliates.
 import os
 from enum import Enum
 from typing import Optional, Tuple, Union
@@ -14,15 +15,16 @@ from torch.nn.attention.flex_attention import (
 )
 from xformers.ops import AttentionBias, fmha
-from bytelatent import probe
 from bytelatent.tokenizers.constants import EOS_ID
 try:
     from apex.normalization.fused_layer_norm import FusedRMSNorm
     RMSNorm = FusedRMSNorm
 except (ImportError, ModuleNotFoundError):
-    print("Apex not found. Using nn.RMSNorm")
     RMSNorm = nn.RMSNorm
 if int(os.environ.get("BLT_ALLOW_MISSING_FLEX_ATTENTION", False)) == 0:

 # Copyright (c) Meta Platforms, Inc. and affiliates.
+import logging
 import os
 from enum import Enum
 from typing import Optional, Tuple, Union
 )
 from xformers.ops import AttentionBias, fmha
 from bytelatent.tokenizers.constants import EOS_ID
+logger = logging.getLogger()
 try:
     from apex.normalization.fused_layer_norm import FusedRMSNorm
     RMSNorm = FusedRMSNorm
 except (ImportError, ModuleNotFoundError):
+    logging.debug("Apex not found. Using nn.RMSNorm")
     RMSNorm = nn.RMSNorm
 if int(os.environ.get("BLT_ALLOW_MISSING_FLEX_ATTENTION", False)) == 0:

bytelatent/model/latent_transformer.py CHANGED Viewed

@@ -17,16 +17,15 @@ from bytelatent.base_transformer import (
 )
 from bytelatent.model.utils import create_causal_mask
 try:
     from apex.normalization.fused_layer_norm import FusedRMSNorm
     RMSNorm = FusedRMSNorm
 except (ImportError, ModuleNotFoundError):
-    print("Apex not found. Using nn.RMSNorm")
     RMSNorm = nn.RMSNorm
-logger = logging.getLogger()
 class CrossAttention(nn.Module):
     """

 )
 from bytelatent.model.utils import create_causal_mask
+logger = logging.getLogger()
 try:
     from apex.normalization.fused_layer_norm import FusedRMSNorm
     RMSNorm = FusedRMSNorm
 except (ImportError, ModuleNotFoundError):
+    logging.debug("Apex not found. Using nn.RMSNorm")
     RMSNorm = nn.RMSNorm
 class CrossAttention(nn.Module):
     """

bytelatent/model/local_models.py CHANGED Viewed

@@ -6,7 +6,7 @@ from typing import Any, List, Optional, Tuple, Union
 import torch
 import torch.nn
 import torch.nn as nn
-from pydantic import BaseModel, ConfigDict
 from torch.nn import functional as F
 from torch.nn.attention.flex_attention import BlockMask
 from xformers.ops import AttentionBias
@@ -21,16 +21,15 @@ from bytelatent.model.latent_transformer import CrossAttention
 from bytelatent.model.utils import create_causal_mask, downsample
 from bytelatent.tokenizers.blt_tokenizer import BOE_ID
 try:
     from apex.normalization.fused_layer_norm import FusedRMSNorm
     RMSNorm = FusedRMSNorm
 except (ImportError, ModuleNotFoundError):
-    print("Apex not found. Using nn.RMSNorm")
     RMSNorm = nn.RMSNorm
-logger = logging.getLogger()
 class LocalModelArgs(BaseTransformerArgs):
     model_config = ConfigDict(extra="forbid")

 import torch
 import torch.nn
 import torch.nn as nn
+from pydantic import ConfigDict
 from torch.nn import functional as F
 from torch.nn.attention.flex_attention import BlockMask
 from xformers.ops import AttentionBias
 from bytelatent.model.utils import create_causal_mask, downsample
 from bytelatent.tokenizers.blt_tokenizer import BOE_ID
+logger = logging.getLogger()
 try:
     from apex.normalization.fused_layer_norm import FusedRMSNorm
     RMSNorm = FusedRMSNorm
 except (ImportError, ModuleNotFoundError):
+    logging.debug("Apex not found. Using nn.RMSNorm")
     RMSNorm = nn.RMSNorm
 class LocalModelArgs(BaseTransformerArgs):
     model_config = ConfigDict(extra="forbid")

bytelatent/transformer.py CHANGED Viewed

@@ -1,6 +1,6 @@
 # Copyright (c) Meta Platforms, Inc. and affiliates.
-from dataclasses import dataclass
 from typing import Optional, Tuple, Union
 import torch
@@ -14,7 +14,7 @@ from torch.distributed.tensor.parallel import (
     parallelize_module,
 )
 from torch.nn.attention.flex_attention import BlockMask, create_block_mask
-from xformers.ops import AttentionBias, fmha
 from bytelatent.base_transformer import (
     BaseTransformer,
@@ -23,12 +23,14 @@ from bytelatent.base_transformer import (
 )
 from bytelatent.model.utils import create_causal_mask
 try:
     from apex.normalization.fused_layer_norm import FusedRMSNorm
     RMSNorm = FusedRMSNorm
 except (ImportError, ModuleNotFoundError):
-    print("Apex not found. Using nn.RMSNorm")
     RMSNorm = nn.RMSNorm

 # Copyright (c) Meta Platforms, Inc. and affiliates.
+import logging
 from typing import Optional, Tuple, Union
 import torch
     parallelize_module,
 )
 from torch.nn.attention.flex_attention import BlockMask, create_block_mask
+from xformers.ops import AttentionBias
 from bytelatent.base_transformer import (
     BaseTransformer,
 )
 from bytelatent.model.utils import create_causal_mask
+logger = logging.getLogger()
 try:
     from apex.normalization.fused_layer_norm import FusedRMSNorm
     RMSNorm = FusedRMSNorm
 except (ImportError, ModuleNotFoundError):
+    logging.debug("Apex not found. Using nn.RMSNorm")
     RMSNorm = nn.RMSNorm