Spaces:

Knowles-Lab
/

tiger

Running on CPU Upgrade

astirn commited on Jul 6, 2023

Commit

e9d876c

1 Parent(s): 66b2911

progress

Files changed (1) hide show

app.py CHANGED Viewed

@@ -73,13 +73,16 @@ def process_input():
     # convert to upper case as used by tokenizer
     st.session_state.transcripts[tiger.SEQ_COL] = st.session_state.transcripts[tiger.SEQ_COL].apply(lambda s: s.upper())
-    # if src_seq and all([True if nt.upper() in NUCLEOTIDE_TOKENS.keys() else False for nt in src_seq]):
-    # elif src_seq is not None:
-    #     st.write('Invalid input!')
     print(st.session_state.transcripts)
-    # everything looks good to run the model
     st.session_state.run = True

     # convert to upper case as used by tokenizer
     st.session_state.transcripts[tiger.SEQ_COL] = st.session_state.transcripts[tiger.SEQ_COL].apply(lambda s: s.upper())
+    # make sure all transcripts only contain nucleotides A, C, G, T, and wildcard N
+    valid = st.session_state.transcripts[tiger.SEQ_COL].apply(lambda s: set(s).issubset(tiger.NUCLEOTIDE_TOKENS.keys()))
+    if not all(valid):
+        with TRANSCRIPT_ENTRY:
+            st.write('Transcript(s) must only contain upper or lower case A, C, G, and Ts')
+        return
     print(st.session_state.transcripts)
+    # everything looks good, so run the model
     st.session_state.run = True