Class: Transformers::Distilbert::DistilBertTokenizerFast

Inherits:

Object
PreTrainedTokenizerBase
PreTrainedTokenizerFast
Transformers::Distilbert::DistilBertTokenizerFast

show all

Defined in:: lib/transformers/models/distilbert/tokenization_distilbert_fast.rb

Constant Summary collapse

VOCAB_FILES_NAMES =

{vocab_file: "vocab.txt", tokenizer_file: "tokenizer.json"}

Constants included from SpecialTokensMixin

SpecialTokensMixin::SPECIAL_TOKENS_ATTRIBUTES

Instance Attribute Summary

Attributes inherited from PreTrainedTokenizerBase

#init_kwargs, #model_max_length

Instance Method Summary collapse

Constructor Details

#initialize(vocab_file: nil, tokenizer_file: nil, do_lower_case: true, unk_token: "[UNK]", sep_token: "[SEP]", pad_token: "[PAD]", cls_token: "[CLS]", mask_token: "[MASK]", tokenize_chinese_chars: true, strip_accents: nil, **kwargs) ⇒ `DistilBertTokenizerFast`

Returns a new instance of DistilBertTokenizerFast.

# File 'lib/transformers/models/distilbert/tokenization_distilbert_fast.rb', line 24

def initialize(
  vocab_file: nil,
  tokenizer_file: nil,
  do_lower_case: true,
  unk_token: "[UNK]",
  sep_token: "[SEP]",
  pad_token: "[PAD]",
  cls_token: "[CLS]",
  mask_token: "[MASK]",
  tokenize_chinese_chars: true,
  strip_accents: nil,
  **kwargs
)
  super(
    vocab_file,
    tokenizer_file: tokenizer_file,
    do_lower_case: do_lower_case,
    unk_token: unk_token,
    sep_token: sep_token,
    pad_token: pad_token,
    cls_token: cls_token,
    mask_token: mask_token,
    tokenize_chinese_chars: tokenize_chinese_chars,
    strip_accents: strip_accents,
    **kwargs
  )

  if @backend_tokenizer
    raise Todo
  end

  @do_lower_case = do_lower_case
end

Instance Method Details

#build_inputs_with_special_tokens(token_ids_0, token_ids_1 = nil) ⇒ `Object`

Raises:

(Todo)



58
59
60

# File 'lib/transformers/models/distilbert/tokenization_distilbert_fast.rb', line 58

def build_inputs_with_special_tokens(token_ids_0, token_ids_1 = nil)
  raise Todo
end

#create_token_type_ids_from_sequences(token_ids_0, token_ids_1 = nil) ⇒ `Object`

Raises:

(Todo)



62
63
64

# File 'lib/transformers/models/distilbert/tokenization_distilbert_fast.rb', line 62

def create_token_type_ids_from_sequences(token_ids_0, token_ids_1 = nil)
  raise Todo
end

#save_vocabulary(save_directory, filename_prefix: nil) ⇒ `Object`

Raises:

(Todo)



66
67
68

# File 'lib/transformers/models/distilbert/tokenization_distilbert_fast.rb', line 66

def save_vocabulary(save_directory, filename_prefix: nil)
  raise Todo
end

Class: Transformers::Distilbert::DistilBertTokenizerFast

Constant Summary collapse

Constants included from SpecialTokensMixin

Instance Attribute Summary

Attributes inherited from PreTrainedTokenizerBase

Instance Method Summary collapse

Methods inherited from PreTrainedTokenizerFast

Methods inherited from PreTrainedTokenizerBase

Methods included from ClassAttribute

Methods included from SpecialTokensMixin

Constructor Details

#initialize(vocab_file: nil, tokenizer_file: nil, do_lower_case: true, unk_token: "[UNK]", sep_token: "[SEP]", pad_token: "[PAD]", cls_token: "[CLS]", mask_token: "[MASK]", tokenize_chinese_chars: true, strip_accents: nil, **kwargs) ⇒ DistilBertTokenizerFast

Instance Method Details

#build_inputs_with_special_tokens(token_ids_0, token_ids_1 = nil) ⇒ Object

#create_token_type_ids_from_sequences(token_ids_0, token_ids_1 = nil) ⇒ Object

#save_vocabulary(save_directory, filename_prefix: nil) ⇒ Object

#initialize(vocab_file: nil, tokenizer_file: nil, do_lower_case: true, unk_token: "[UNK]", sep_token: "[SEP]", pad_token: "[PAD]", cls_token: "[CLS]", mask_token: "[MASK]", tokenize_chinese_chars: true, strip_accents: nil, **kwargs) ⇒ `DistilBertTokenizerFast`

#build_inputs_with_special_tokens(token_ids_0, token_ids_1 = nil) ⇒ `Object`

#create_token_type_ids_from_sequences(token_ids_0, token_ids_1 = nil) ⇒ `Object`

#save_vocabulary(save_directory, filename_prefix: nil) ⇒ `Object`