metadata
tags:
- sentence-transformers
- sentence-similarity
- feature-extraction
- generated_from_trainer
- dataset_size:6260
- loss:ContrastiveLoss
base_model: intfloat/multilingual-e5-base
widget:
- source_sentence: "Type de project: Le projet porté par la structure candidate doit associer plusieurs structures professionnelles franciliennes. Ces structures s’engagent à mutualiser leurs moyens et compétences en vue d’un projet commun. Le projet doit concerner un nombre significatif d’équipes artistiques ou de projets artistiques professionnels.\n Il s'agit d'une aide : \n À l’incubation de projets artistiques et au compagnonnage. Cette aide vise à offrir aux artistes une aide à la structuration économique, administrative, à l’insertion professionnelle, à la mise en réseau.\n Et/ou : Au repérage artistique et à la visibilité. Cette aide vise à valoriser des projets artistiques en cours de création ou déjà finalisés, en vue de leur production et de leur diffusion, et à encourager la rencontre et les collaborations entre des artistes et des structures professionnelles.\_Plus de détails dans la délibération."
sentences:
- '[structure candidate] (organisation)'
- >-
[structure accompagnatrice](organisation) --- AGRÉÉ_PAR --->
[État](organisation)
- '[Lundi 19 Février 2024] (date)'
- source_sentence: >-
Procédures et démarches: La demande est à effectuer en ligne sur la
plateforme mesdemarches.iledefrance.frLes dates limites de dépôt sont :
avant le 1er décembre, le 1er février, le 1er juin ou le 16 août 2024
(pour une réponse fin novembre).
Bénéficiaires: Association - Fondation, Association - Régie par la loi de
1901, Association - ONG, Collectivité ou institution - Communes de 10 000
à 20 000 hab, Collectivité ou institution - Communes de 2000 à 10 000 hab,
Collectivité ou institution - Communes de < 2000 hab, Collectivité ou
institution - Communes de > 20 000 hab, Collectivité ou institution -
Département, Collectivité ou institution - EPCI, Collectivité ou
institution - EPT / Métropole du Grand Paris, Collectivité ou institution
- Bailleurs sociaux, Collectivité ou institution - Autre (GIP,
copropriété, EPA...), Collectivité ou institution - Office de tourisme
intercommunal
Précision sure les bénéficiaires: nan
sentences:
- >-
[petites entreprises innovantes franciliennes](bénéficiaire) --- INCLUT
---> [Professionnel - PME < 250](bénéficiaire)
- >-
[plateforme mesdemarches.iledefrance.fr](plateforme) --- BÉNÉFICIAIRE
---> [Association - Fondation](entité)
- >-
[mesdemarches.iledefrance.fr](plateforme) --- ACCEPTE_DOSSIERS --->
[Collectivité ou institution - Communes de 2000 à 10 000
hab](organisation)
- source_sentence: >-
Procédures et démarches: Pour bénéficier de ce programme, il convient de
s’inscrire directement auprès de l’association 100 000 Entrepreneurs.
Bénéficiaires: Particulier - Lycéen, Établissement d'enseignement
secondaire
Précision sure les bénéficiaires: Elèves de 4ème, 3ème, Seconde, Première,
Terminale
sentences:
- '[collaborateurs et collaboratrices d’entreprises] (groupe)'
- >-
[Collectivité ou institution - Autre (GIP, copropriété, EPA...)]
(bénéficiaire)
- '[prévention contre discrimination] (thématique)'
- source_sentence: "Type de project: L’appel à projets vise l'émergence de lieux ouverts et collaboratifs favorisant le développement des entreprises par l’innovation, en leur permettant d'accéder à un ensemble de services, d’espaces et d’équipements mutualisés, dont : Des unités industrielles partagées ou plateformes de service permettant à des entreprises d'une même filière de mutualiser leurs investissements.Des espaces destinés à :- Une mise en commun de compétences techniques permettant aux entreprises de mutualiser leurs travaux de R&D et/ou les investissements nécessaires à la conduite de travaux de R&D,-\_Une mise en place d’outils collaboratifs. Concrètement, les projets attendus s'apparentent à : Une plateforme technologique, Un site de R&D collaborative appliquée, Un site d’essais et d’expérimentations, Un banc d’essai mutualisé, Une unité industrielle pilote, Un incubateur, Un accélérateur..."
sentences:
- >-
[mesdemarches.iledefrance.fr](plateforme) --- ACCEPTE_DOSSIERS --->
[Collectivité ou institution - Communes de > 20 000 hab](organisation)
- >-
[mesdemarches.iledefrance.fr](plateforme) --- ACCEPTE_DEMANDE --->
[Professionnel - Patrimoine](bénéficiaire)
- >-
[banc d’essai mutualisé](concept) --- APPARTIENT --->
[projets](__inferred__)
- source_sentence: >-
Procédures et démarches: Dépôt du dossier de candidature sur la plateforme
des aides régionales (mesdemarches.iledefrance.fr).
Bénéficiaires: Collectivité ou institution - Communes de < 2000 hab,
Collectivité ou institution - Communes de 2000 à 10 000 hab, Collectivité
ou institution - Communes de 10 000 à 20 000 hab, Collectivité ou
institution - Communes de > 20 000 hab, Collectivité ou institution -
EPCI, Collectivité ou institution - EPT / Métropole du Grand Paris,
Collectivité ou institution - Département, Collectivité ou institution -
Bailleurs sociaux, Collectivité ou institution - Autre (GIP, copropriété,
EPA...)
Précision sure les bénéficiaires: Toutes les structures de droit public ou
de droit privé
sentences:
- '[Collectivité ou institution - Communes de < 2000 hab] (collectivité)'
- >-
[petites entreprises innovantes franciliennes](bénéficiaire) --- INCLUT
---> [Professionnel - Créateur d'entreprise](bénéficiaire)
- >-
[établissement d'enseignement secondaire](organisation) --- DESTINE_A
---> [élèves des lycées franciliens](groupe)
datasets:
- Lettria/GRAG-GO-IDF-Pos-Neg
pipeline_tag: sentence-similarity
library_name: sentence-transformers
metrics:
- pearson_cosine
- spearman_cosine
- cosine_accuracy
- cosine_accuracy_threshold
- cosine_f1
- cosine_f1_threshold
- cosine_precision
- cosine_recall
- cosine_ap
model-index:
- name: SentenceTransformer based on intfloat/multilingual-e5-base
results:
- task:
type: semantic-similarity
name: Semantic Similarity
dataset:
name: EmbeddingSimEval
type: EmbeddingSimEval
metrics:
- type: pearson_cosine
value: 0.5444068848606196
name: Pearson Cosine
- type: spearman_cosine
value: 0.48932091320327376
name: Spearman Cosine
- task:
type: binary-classification
name: Binary Classification
dataset:
name: BinaryClassifEval
type: BinaryClassifEval
metrics:
- type: cosine_accuracy
value: 0.8604091456077015
name: Cosine Accuracy
- type: cosine_accuracy_threshold
value: 0.8192634582519531
name: Cosine Accuracy Threshold
- type: cosine_f1
value: 0.9166067577282532
name: Cosine F1
- type: cosine_f1_threshold
value: 0.8192634582519531
name: Cosine F1 Threshold
- type: cosine_precision
value: 0.8750857927247769
name: Cosine Precision
- type: cosine_recall
value: 0.9622641509433962
name: Cosine Recall
- type: cosine_ap
value: 0.9556819734522246
name: Cosine Ap
SentenceTransformer based on intfloat/multilingual-e5-base
This is a sentence-transformers model finetuned from intfloat/multilingual-e5-base on the grag-go-idf-pos-neg dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
Model Details
Model Description
- Model Type: Sentence Transformer
- Base model: intfloat/multilingual-e5-base
- Maximum Sequence Length: 512 tokens
- Output Dimensionality: 768 dimensions
- Similarity Function: Cosine Similarity
- Training Dataset:
Model Sources
- Documentation: Sentence Transformers Documentation
- Repository: Sentence Transformers on GitHub
- Hugging Face: Sentence Transformers on Hugging Face
Full Model Architecture
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
Usage
Direct Usage (Sentence Transformers)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("Lettria/idf-chunk_embedder-contrastive-after_epoch_0")
# Run inference
sentences = [
'Procédures et démarches: Dépôt du dossier de candidature sur la plateforme des aides régionales (mesdemarches.iledefrance.fr).\nBénéficiaires: Collectivité ou institution - Communes de < 2000 hab, Collectivité ou institution - Communes de 2000 à 10 000 hab, Collectivité ou institution - Communes de 10 000 à 20 000 hab, Collectivité ou institution - Communes de > 20 000 hab, Collectivité ou institution - EPCI, Collectivité ou institution - EPT / Métropole du Grand Paris, Collectivité ou institution - Département, Collectivité ou institution - Bailleurs sociaux, Collectivité ou institution - Autre (GIP, copropriété, EPA...)\nPrécision sure les bénéficiaires: Toutes les structures de droit public ou de droit privé',
'[Collectivité ou institution - Communes de < 2000 hab] (collectivité)',
"[petites entreprises innovantes franciliennes](bénéficiaire) --- INCLUT ---> [Professionnel - Créateur d'entreprise](bénéficiaire)",
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
Evaluation
Metrics
Semantic Similarity
- Dataset:
EmbeddingSimEval
- Evaluated with
EmbeddingSimilarityEvaluator
Metric | Value |
---|---|
pearson_cosine | 0.5444 |
spearman_cosine | 0.4893 |
Binary Classification
- Dataset:
BinaryClassifEval
- Evaluated with
BinaryClassificationEvaluator
Metric | Value |
---|---|
cosine_accuracy | 0.8604 |
cosine_accuracy_threshold | 0.8193 |
cosine_f1 | 0.9166 |
cosine_f1_threshold | 0.8193 |
cosine_precision | 0.8751 |
cosine_recall | 0.9623 |
cosine_ap | 0.9557 |
Training Details
Training Dataset
grag-go-idf-pos-neg
- Dataset: grag-go-idf-pos-neg at ecbf53b
- Size: 6,260 training samples
- Columns:
sentence1
,sentence2
, andlabel
- Approximate statistics based on the first 1000 samples:
sentence1 sentence2 label type string string int details - min: 16 tokens
- mean: 192.75 tokens
- max: 414 tokens
- min: 8 tokens
- mean: 24.08 tokens
- max: 79 tokens
- 0: ~15.70%
- 1: ~84.30%
- Samples:
sentence1 sentence2 label Procédures et démarches: Les porteurs de projet peuvent déposer leurs dossiers de candidature toute l’année sur la plateforme des aides régionales mesdemarches.iledefrance.fr. Après examen par les services de la Région, les élus du Conseil régional désignent les initiatives lauréates et le montant de la dotation régionale prévisionnelle.
Bénéficiaires: Collectivité ou institution - Autre (GIP, copropriété, EPA...), Collectivité ou institution - Bailleurs sociaux, Collectivité ou institution - Communes de 10 000 à 20 000 hab, Collectivité ou institution - Communes de 2000 à 10 000 hab, Collectivité ou institution - Communes de < 2000 hab, Collectivité ou institution - Communes de > 20 000 hab, Collectivité ou institution - Département, Collectivité ou institution - EPCI, Collectivité ou institution - EPT / Métropole du Grand Paris, Collectivité ou institution - Office de tourisme intercommunal, Association - Régie par la loi de 1901, Établissement d'enseignement secondaire, Établissemen...[dotation régionale prévisionnelle] (inferred)
1
Type de project: Pour l'investissement, les dépenses éligibles concernent les aménagements et les rénovations de bâtiments, les constructions et les acquisitions de locaux ainsi que les gros travaux immobiliers.Pour l'équipement, les dépenses éligibles portent sur l'acquisition, la mise en conformité et le renouvellement des équipements destinés à un usage pédagogique, administratif ou destiné aux étudiants.
investissement --- CONCERNE ---> gros travaux immobiliers
1
. Pour les demandes avec devis, transmettez votre demande de versement avec les factures acquittées (dans un délai maximal d'un an). Les factures indiquent un n° de chèque, un règlement CB, un virement,... Le versement prend la forme d'un paiement unique ou d’un paiement en 2 fois. Les dépenses prises en compte en HT portent sur une période maximale de 12 mois.
DIM --- ASSURER ---> financement
0
- Loss:
ContrastiveLoss
with these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Evaluation Dataset
grag-go-idf-pos-neg
- Dataset: grag-go-idf-pos-neg at ecbf53b
- Size: 1,662 evaluation samples
- Columns:
sentence1
,sentence2
, andlabel
- Approximate statistics based on the first 1000 samples:
sentence1 sentence2 label type string string int details - min: 24 tokens
- mean: 178.38 tokens
- max: 394 tokens
- min: 8 tokens
- mean: 25.03 tokens
- max: 136 tokens
- 0: ~19.60%
- 1: ~80.40%
- Samples:
sentence1 sentence2 label Type de project: Le Fonds régional pour le tourisme est destiné aux actions ayant l'un de ces objectifs : La création, l’adaptation et le développement de l’offre d’activités et de loisirs ainsi que le renforcement de la sécurisation des sites touristiques et des visiteurs,La digitalisation de l’offre touristique pour accélérer la transformation numérique et favoriser l’innovation,La création d’offres d’hébergements touristiques durables contribuant à l’enrichissement de l’offre touristique régionale,Le soutien aux évènements gastronomiques d’envergure régionale. Afin que les professionnels du tourisme s’adaptent et contribuent à la transition durable de la destination Paris Île-de-France, l’aide régionale est attribuée sur la base de critères d’éco-conditionnalité.
Fonds régional pour le tourisme --- DESTINÉ ---> professionnels du tourisme
1
Type de project: Les projets éligibles doivent être basés sur un projet de développement pluriannuel élaboré par chaque structure bénéficiaire concernée. Le projet de développement s’inscrit dans les orientations de sa fédération.Les formations doivent être professionnalisantes, diplômantes ou continues, en ce qui concerne l’encadrement éducatif et technique et les dirigeants bénévoles et officiels.Une attention particulière est portée sur les formations sur les thématiques de la prévention contre toutes violences, de discrimination et de radicalisation.
dépôt des dossiers --- DÉLAI ---> Commission
0
Type de project: Les thématiques abordées, au titre du programme, comprennent la santé numérique et les risques de dépendance, la protection des données personnelles et la prévention des situations de harcèlement et de cyberharcèlement ; les interventions questionnent aussi les aspects numériques de la vie affective et sexuelle et son corollaire de risques tels que le "sexting", le "Revenge porn", le chantage sexuel et l'impact de la pornographie sur les jeunes. A la demande des établissements, des focus thématiques peuvent être réalisés sur d'autres sujets comme la prévention des phénomènes de prostitution des mineurs, les problématiques liées aux jeux d'argent et de hasard en ligne ou encore la lutte contre la désinformation à travers une approche d'éducation aux médias et à l'information. Les établissements bénéficiaires peuvent choisir jusqu'à deux thématiques qu'ils identifient comme prioritaires.
[sexting] (risque)
1
- Loss:
ContrastiveLoss
with these parameters:{ "distance_metric": "SiameseDistanceMetric.COSINE_DISTANCE", "margin": 0.5, "size_average": true }
Training Hyperparameters
Non-Default Hyperparameters
eval_strategy
: epochper_device_train_batch_size
: 4per_device_eval_batch_size
: 4gradient_accumulation_steps
: 8num_train_epochs
: 10warmup_steps
: 626
All Hyperparameters
Click to expand
overwrite_output_dir
: Falsedo_predict
: Falseeval_strategy
: epochprediction_loss_only
: Trueper_device_train_batch_size
: 4per_device_eval_batch_size
: 4per_gpu_train_batch_size
: Noneper_gpu_eval_batch_size
: Nonegradient_accumulation_steps
: 8eval_accumulation_steps
: Nonetorch_empty_cache_steps
: Nonelearning_rate
: 5e-05weight_decay
: 0.0adam_beta1
: 0.9adam_beta2
: 0.999adam_epsilon
: 1e-08max_grad_norm
: 1.0num_train_epochs
: 10max_steps
: -1lr_scheduler_type
: linearlr_scheduler_kwargs
: {}warmup_ratio
: 0.0warmup_steps
: 626log_level
: passivelog_level_replica
: warninglog_on_each_node
: Truelogging_nan_inf_filter
: Truesave_safetensors
: Truesave_on_each_node
: Falsesave_only_model
: Falserestore_callback_states_from_checkpoint
: Falseno_cuda
: Falseuse_cpu
: Falseuse_mps_device
: Falseseed
: 42data_seed
: Nonejit_mode_eval
: Falseuse_ipex
: Falsebf16
: Falsefp16
: Falsefp16_opt_level
: O1half_precision_backend
: autobf16_full_eval
: Falsefp16_full_eval
: Falsetf32
: Nonelocal_rank
: 0ddp_backend
: Nonetpu_num_cores
: Nonetpu_metrics_debug
: Falsedebug
: []dataloader_drop_last
: Falsedataloader_num_workers
: 0dataloader_prefetch_factor
: Nonepast_index
: -1disable_tqdm
: Falseremove_unused_columns
: Truelabel_names
: Noneload_best_model_at_end
: Falseignore_data_skip
: Falsefsdp
: []fsdp_min_num_params
: 0fsdp_config
: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap
: Noneaccelerator_config
: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}deepspeed
: Nonelabel_smoothing_factor
: 0.0optim
: adamw_torchoptim_args
: Noneadafactor
: Falsegroup_by_length
: Falselength_column_name
: lengthddp_find_unused_parameters
: Noneddp_bucket_cap_mb
: Noneddp_broadcast_buffers
: Falsedataloader_pin_memory
: Truedataloader_persistent_workers
: Falseskip_memory_metrics
: Trueuse_legacy_prediction_loop
: Falsepush_to_hub
: Falseresume_from_checkpoint
: Nonehub_model_id
: Nonehub_strategy
: every_savehub_private_repo
: Falsehub_always_push
: Falsegradient_checkpointing
: Falsegradient_checkpointing_kwargs
: Noneinclude_inputs_for_metrics
: Falseeval_do_concat_batches
: Truefp16_backend
: autopush_to_hub_model_id
: Nonepush_to_hub_organization
: Nonemp_parameters
:auto_find_batch_size
: Falsefull_determinism
: Falsetorchdynamo
: Noneray_scope
: lastddp_timeout
: 1800torch_compile
: Falsetorch_compile_backend
: Nonetorch_compile_mode
: Nonedispatch_batches
: Nonesplit_batches
: Noneinclude_tokens_per_second
: Falseinclude_num_input_tokens_seen
: Falseneftune_noise_alpha
: Noneoptim_target_modules
: Nonebatch_eval_metrics
: Falseeval_on_start
: Falseuse_liger_kernel
: Falseeval_use_gather_object
: Falseprompts
: Nonebatch_sampler
: batch_samplermulti_dataset_batch_sampler
: proportional
Training Logs
Click to expand
Epoch | Step | Training Loss | Validation Loss | EmbeddingSimEval_spearman_cosine | BinaryClassifEval_cosine_ap |
---|---|---|---|---|---|
0.0051 | 1 | 0.0194 | - | - | - |
0.0102 | 2 | 0.0198 | - | - | - |
0.0153 | 3 | 0.0146 | - | - | - |
0.0204 | 4 | 0.017 | - | - | - |
0.0256 | 5 | 0.0193 | - | - | - |
0.0307 | 6 | 0.0164 | - | - | - |
0.0358 | 7 | 0.0188 | - | - | - |
0.0409 | 8 | 0.0185 | - | - | - |
0.0460 | 9 | 0.0168 | - | - | - |
0.0511 | 10 | 0.0148 | - | - | - |
0.0562 | 11 | 0.0149 | - | - | - |
0.0613 | 12 | 0.018 | - | - | - |
0.0665 | 13 | 0.0149 | - | - | - |
0.0716 | 14 | 0.0189 | - | - | - |
0.0767 | 15 | 0.0206 | - | - | - |
0.0818 | 16 | 0.0138 | - | - | - |
0.0869 | 17 | 0.0193 | - | - | - |
0.0920 | 18 | 0.0169 | - | - | - |
0.0971 | 19 | 0.014 | - | - | - |
0.1022 | 20 | 0.0151 | - | - | - |
0.1073 | 21 | 0.0157 | - | - | - |
0.1125 | 22 | 0.0127 | - | - | - |
0.1176 | 23 | 0.0159 | - | - | - |
0.1227 | 24 | 0.0184 | - | - | - |
0.1278 | 25 | 0.0188 | - | - | - |
0.1329 | 26 | 0.0191 | - | - | - |
0.1380 | 27 | 0.012 | - | - | - |
0.1431 | 28 | 0.0142 | - | - | - |
0.1482 | 29 | 0.0131 | - | - | - |
0.1534 | 30 | 0.0153 | - | - | - |
0.1585 | 31 | 0.0123 | - | - | - |
0.1636 | 32 | 0.0127 | - | - | - |
0.1687 | 33 | 0.0186 | - | - | - |
0.1738 | 34 | 0.0112 | - | - | - |
0.1789 | 35 | 0.0149 | - | - | - |
0.1840 | 36 | 0.0174 | - | - | - |
0.1891 | 37 | 0.0115 | - | - | - |
0.1942 | 38 | 0.0106 | - | - | - |
0.1994 | 39 | 0.0138 | - | - | - |
0.2045 | 40 | 0.0161 | - | - | - |
0.2096 | 41 | 0.0134 | - | - | - |
0.2147 | 42 | 0.0138 | - | - | - |
0.2198 | 43 | 0.0083 | - | - | - |
0.2249 | 44 | 0.0094 | - | - | - |
0.2300 | 45 | 0.0097 | - | - | - |
0.2351 | 46 | 0.012 | - | - | - |
0.2403 | 47 | 0.0131 | - | - | - |
0.2454 | 48 | 0.0146 | - | - | - |
0.2505 | 49 | 0.0162 | - | - | - |
0.2556 | 50 | 0.0113 | - | - | - |
0.2607 | 51 | 0.0111 | - | - | - |
0.2658 | 52 | 0.0099 | - | - | - |
0.2709 | 53 | 0.0128 | - | - | - |
0.2760 | 54 | 0.0072 | - | - | - |
0.2812 | 55 | 0.0118 | - | - | - |
0.2863 | 56 | 0.0069 | - | - | - |
0.2914 | 57 | 0.0143 | - | - | - |
0.2965 | 58 | 0.0129 | - | - | - |
0.3016 | 59 | 0.0103 | - | - | - |
0.3067 | 60 | 0.0187 | - | - | - |
0.3118 | 61 | 0.0128 | - | - | - |
0.3169 | 62 | 0.0138 | - | - | - |
0.3220 | 63 | 0.021 | - | - | - |
0.3272 | 64 | 0.0142 | - | - | - |
0.3323 | 65 | 0.0144 | - | - | - |
0.3374 | 66 | 0.0164 | - | - | - |
0.3425 | 67 | 0.0115 | - | - | - |
0.3476 | 68 | 0.0122 | - | - | - |
0.3527 | 69 | 0.0125 | - | - | - |
0.3578 | 70 | 0.0119 | - | - | - |
0.3629 | 71 | 0.0098 | - | - | - |
0.3681 | 72 | 0.0112 | - | - | - |
0.3732 | 73 | 0.011 | - | - | - |
0.3783 | 74 | 0.0142 | - | - | - |
0.3834 | 75 | 0.0106 | - | - | - |
0.3885 | 76 | 0.0186 | - | - | - |
0.3936 | 77 | 0.011 | - | - | - |
0.3987 | 78 | 0.0125 | - | - | - |
0.4038 | 79 | 0.0115 | - | - | - |
0.4089 | 80 | 0.0155 | - | - | - |
0.4141 | 81 | 0.0093 | - | - | - |
0.4192 | 82 | 0.017 | - | - | - |
0.4243 | 83 | 0.0106 | - | - | - |
0.4294 | 84 | 0.0115 | - | - | - |
0.4345 | 85 | 0.0105 | - | - | - |
0.4396 | 86 | 0.0105 | - | - | - |
0.4447 | 87 | 0.0117 | - | - | - |
0.4498 | 88 | 0.0104 | - | - | - |
0.4550 | 89 | 0.0093 | - | - | - |
0.4601 | 90 | 0.0125 | - | - | - |
0.4652 | 91 | 0.012 | - | - | - |
0.4703 | 92 | 0.0077 | - | - | - |
0.4754 | 93 | 0.0095 | - | - | - |
0.4805 | 94 | 0.0087 | - | - | - |
0.4856 | 95 | 0.0072 | - | - | - |
0.4907 | 96 | 0.0142 | - | - | - |
0.4958 | 97 | 0.0053 | - | - | - |
0.5010 | 98 | 0.0072 | - | - | - |
0.5061 | 99 | 0.0096 | - | - | - |
0.5112 | 100 | 0.0082 | - | - | - |
0.5163 | 101 | 0.0053 | - | - | - |
0.5214 | 102 | 0.0072 | - | - | - |
0.5265 | 103 | 0.007 | - | - | - |
0.5316 | 104 | 0.0088 | - | - | - |
0.5367 | 105 | 0.0084 | - | - | - |
0.5419 | 106 | 0.0057 | - | - | - |
0.5470 | 107 | 0.0092 | - | - | - |
0.5521 | 108 | 0.0074 | - | - | - |
0.5572 | 109 | 0.0043 | - | - | - |
0.5623 | 110 | 0.0092 | - | - | - |
0.5674 | 111 | 0.0114 | - | - | - |
0.5725 | 112 | 0.0094 | - | - | - |
0.5776 | 113 | 0.0073 | - | - | - |
0.5827 | 114 | 0.0103 | - | - | - |
0.5879 | 115 | 0.0091 | - | - | - |
0.5930 | 116 | 0.0064 | - | - | - |
0.5981 | 117 | 0.011 | - | - | - |
0.6032 | 118 | 0.0085 | - | - | - |
0.6083 | 119 | 0.0061 | - | - | - |
0.6134 | 120 | 0.0036 | - | - | - |
0.6185 | 121 | 0.0087 | - | - | - |
0.6236 | 122 | 0.0072 | - | - | - |
0.6288 | 123 | 0.0028 | - | - | - |
0.6339 | 124 | 0.0116 | - | - | - |
0.6390 | 125 | 0.0156 | - | - | - |
0.6441 | 126 | 0.0048 | - | - | - |
0.6492 | 127 | 0.0049 | - | - | - |
0.6543 | 128 | 0.0048 | - | - | - |
0.6594 | 129 | 0.0021 | - | - | - |
0.6645 | 130 | 0.0085 | - | - | - |
0.6696 | 131 | 0.0058 | - | - | - |
0.6748 | 132 | 0.0067 | - | - | - |
0.6799 | 133 | 0.0162 | - | - | - |
0.6850 | 134 | 0.0056 | - | - | - |
0.6901 | 135 | 0.0035 | - | - | - |
0.6952 | 136 | 0.0069 | - | - | - |
0.7003 | 137 | 0.0018 | - | - | - |
0.7054 | 138 | 0.0026 | - | - | - |
0.7105 | 139 | 0.0111 | - | - | - |
0.7157 | 140 | 0.0041 | - | - | - |
0.7208 | 141 | 0.0098 | - | - | - |
0.7259 | 142 | 0.0045 | - | - | - |
0.7310 | 143 | 0.0059 | - | - | - |
0.7361 | 144 | 0.0068 | - | - | - |
0.7412 | 145 | 0.0065 | - | - | - |
0.7463 | 146 | 0.0085 | - | - | - |
0.7514 | 147 | 0.0077 | - | - | - |
0.7565 | 148 | 0.0047 | - | - | - |
0.7617 | 149 | 0.005 | - | - | - |
0.7668 | 150 | 0.0031 | - | - | - |
0.7719 | 151 | 0.0042 | - | - | - |
0.7770 | 152 | 0.0054 | - | - | - |
0.7821 | 153 | 0.0021 | - | - | - |
0.7872 | 154 | 0.004 | - | - | - |
0.7923 | 155 | 0.0027 | - | - | - |
0.7974 | 156 | 0.0033 | - | - | - |
0.8026 | 157 | 0.0044 | - | - | - |
0.8077 | 158 | 0.0063 | - | - | - |
0.8128 | 159 | 0.0078 | - | - | - |
0.8179 | 160 | 0.0046 | - | - | - |
0.8230 | 161 | 0.0076 | - | - | - |
0.8281 | 162 | 0.0136 | - | - | - |
0.8332 | 163 | 0.0048 | - | - | - |
0.8383 | 164 | 0.0049 | - | - | - |
0.8435 | 165 | 0.0048 | - | - | - |
0.8486 | 166 | 0.0064 | - | - | - |
0.8537 | 167 | 0.0038 | - | - | - |
0.8588 | 168 | 0.0087 | - | - | - |
0.8639 | 169 | 0.0067 | - | - | - |
0.8690 | 170 | 0.0011 | - | - | - |
0.8741 | 171 | 0.0067 | - | - | - |
0.8792 | 172 | 0.0054 | - | - | - |
0.8843 | 173 | 0.0069 | - | - | - |
0.8895 | 174 | 0.0084 | - | - | - |
0.8946 | 175 | 0.0038 | - | - | - |
0.8997 | 176 | 0.0029 | - | - | - |
0.9048 | 177 | 0.002 | - | - | - |
0.9099 | 178 | 0.0073 | - | - | - |
0.9150 | 179 | 0.0069 | - | - | - |
0.9201 | 180 | 0.0042 | - | - | - |
0.9252 | 181 | 0.0037 | - | - | - |
0.9304 | 182 | 0.0034 | - | - | - |
0.9355 | 183 | 0.0038 | - | - | - |
0.9406 | 184 | 0.0038 | - | - | - |
0.9457 | 185 | 0.007 | - | - | - |
0.9508 | 186 | 0.0019 | - | - | - |
0.9559 | 187 | 0.0073 | - | - | - |
0.9610 | 188 | 0.0054 | - | - | - |
0.9661 | 189 | 0.0082 | - | - | - |
0.9712 | 190 | 0.0058 | - | - | - |
0.9764 | 191 | 0.0028 | - | - | - |
0.9815 | 192 | 0.0036 | - | - | - |
0.9866 | 193 | 0.0046 | - | - | - |
0.9917 | 194 | 0.0066 | - | - | - |
0.9968 | 195 | 0.0056 | 0.0152 | 0.4893 | 0.9557 |
Framework Versions
- Python: 3.11.9
- Sentence Transformers: 3.3.1
- Transformers: 4.45.2
- PyTorch: 2.4.1+cu121
- Accelerate: 1.2.1
- Datasets: 3.2.0
- Tokenizers: 0.20.3
Citation
BibTeX
Sentence Transformers
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
ContrastiveLoss
@inproceedings{hadsell2006dimensionality,
author={Hadsell, R. and Chopra, S. and LeCun, Y.},
booktitle={2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR'06)},
title={Dimensionality Reduction by Learning an Invariant Mapping},
year={2006},
volume={2},
number={},
pages={1735-1742},
doi={10.1109/CVPR.2006.100}
}