TimeSformer [[timesformer]]
κ°μ [[overview]]
TimeSformer λͺ¨λΈμ Facebook Researchμμ μ μν TimeSformer: Is Space-Time Attention All You Need for Video Understanding?μμ μκ°λμμ΅λλ€. μ΄ μ°κ΅¬λ 첫 λ²μ§Έ λΉλμ€ Transformerλ‘μ, νλ μΈμ λΆμΌμμ μ€μν μ΄μ νκ° λμμ΅λλ€. λν Transformer κΈ°λ°μ λΉλμ€ μ΄ν΄ λ° λΆλ₯ λ Όλ¬Έμ λ§μ μκ°μ μ£Όμμ΅λλ€.
λ Όλ¬Έμ μ΄λ‘μ λ€μκ³Ό κ°μ΅λλ€.
μ°λ¦¬λ 곡κ°κ³Ό μκ°μ κ±Έμ³ μ ν μ΄ν μ λ§μ μ¬μ©νλ ν©μ±κ³±μ΄ μλ(convolution-free) λΉλμ€ λΆλ₯ λ°©λ²μ μ μν©λλ€. μ΄ λ°©λ²μ βTimeSformerβλΌκ³ λΆλ¦¬λ©°, νμ€ Transformer μν€ν μ²λ₯Ό λΉλμ€μ μ μ©νμ¬ νλ μ μμ€ ν¨μΉ μνμ€λ‘λΆν° μ§μ μ곡κ°μ νΉμ§μ νμ΅ν μ μκ² ν©λλ€. μ°λ¦¬μ μ€νμ μ°κ΅¬λ λ€μν μ ν μ΄ν μ λ°©μμ λΉκ΅νλ©°, μκ°μ μ΄ν μ κ³Ό 곡κ°μ μ΄ν μ μ κ°κ°μ λΈλ‘ λ΄μμ λ³λλ‘ μ μ©νλ βλΆν μ΄ν μ β λ°©μμ΄ κ³ λ €λ μ€κ³ μ ν μ€ κ°μ₯ μ°μν λΉλμ€ λΆλ₯ μ νλλ₯Ό μ 곡νλ€λ κ²μ μμ¬ν©λλ€. μ΄ νμ μ μΈ μ€κ³μλ λΆκ΅¬νκ³ , TimeSformerλ Kinetics-400 λ° Kinetics-600μ ν¬ν¨ν μ¬λ¬ νλ μΈμ λ²€μΉλ§ν¬μμ μ΅μ²¨λ¨ κ²°κ³Όλ₯Ό λ¬μ±νμΌλ©°, νμ¬κΉμ§ λ³΄κ³ λ κ°μ₯ λμ μ νλλ₯Ό κΈ°λ‘νμ΅λλ€. λ§μ§λ§μΌλ‘, 3D ν©μ±κ³± λ€νΈμν¬μ λΉκ΅νμ λ, TimeSformerλ λ λΉ λ₯΄κ² νμ΅ν μ μμΌλ©°, μ½κ°μ μ νλ μ νλ₯Ό κ°μνλ©΄ ν μ€νΈ ν¨μ¨μ±μ΄ ν¬κ² ν₯μλκ³ , 1λΆ μ΄μμ κΈ΄ λΉλμ€ ν΄λ¦½μλ μ μ©ν μ μμ΅λλ€. μ½λμ λͺ¨λΈμ λ€μ λ§ν¬μμ νμΈν μ μμ΅λλ€: https URL λ§ν¬.
μ΄ λͺ¨λΈμ fcakyonμ΄ κΈ°μ¬νμμ΅λλ€. μλ³Έ μ½λλ μ¬κΈ°μμ νμΈν μ μμ΅λλ€.
μ¬μ© ν [[usage-tips]]
λ€μν μ¬μ νμ΅λ λͺ¨λΈμ λ³νλ€μ΄ μμ΅λλ€. μ¬μ©νλ €λ λ°μ΄ν°μ μ λ§μΆ° μ¬μ νμ΅λ λͺ¨λΈμ μ νν΄μΌ ν©λλ€. λν, λͺ¨λΈ ν¬κΈ°μ λ°λΌ ν΄λ¦½λΉ μ λ ₯ νλ μ μκ° λ¬λΌμ§λ―λ‘, μ¬μ νμ΅λ λͺ¨λΈμ μ νν λ μ΄ λ§€κ°λ³μλ₯Ό κ³ λ €ν΄μΌ ν©λλ€.
리μμ€ [[resources]]
TimesformerConfig [[transformers.TimesformerConfig]]
[[autodoc]] TimesformerConfig
TimesformerModel [[transformers.TimesformerModel]]
[[autodoc]] TimesformerModel - forward
TimesformerForVideoClassification [[transformers.TimesformerForVideoClassification]]
[[autodoc]] TimesformerForVideoClassification - forward